جمع بيانات تدريب كلمة الاستيقاظ

أنشئ تطبيقات صوتية تستمع دائمًا إلى بيانات مخصصة للتدريب على كلمات التنبيه.
Wake Word Training Data-Banner

عملاء متميزون

تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.

أمازون
جوجل
Microsoft
كوجنيت

بناء بوابة بينك وبين منتجاتك الصوتية باستخدام كلمات تنبيه دقيقة ومخصصة وتعزيز قدرات اكتشاف الكلمات للمساعدين الصوتيين لمساعدتك على البقاء في صدارة المنافسة.

لقد غيّر المساعدون الصوتيون بشكل كبير الطريقة التي يتفاعل بها العملاء مع أجهزتهم. لقد سهلت على المستخدمين استكشاف المنتجات والخدمات - بسرعة وكفاءة. ومع ذلك ، هل يستمع التطبيق الصوتي؟ لوضع هذه التطبيقات في محرك أقراص عالي ، يجب إيقاظهم والانتقال من الاستماع السلبي إلى الاستماع النشط بمساعدة WAKE WORDS. "Alexa" و "Hey Siri" هما أكثر كلمات التنبيه شيوعًا في العالم.

رجل دولة

بحلول عام 2024 ، من المتوقع أن يصل عدد المساعدين الصوتيين الرقميين 8.4 مليار وحدة - أكثر من سكان العالم. 

الأسواق والأسواق

من المتوقع أن يزداد حجم سوق تطبيقات المساعد الصوتي من 2.8 مليار دولار في عام 2021 إلى 11.2 مليار دولار في عام 2026 ، بمعدل نمو سنوي مركب يبلغ 32.4٪. 

ما هي كلمة الاستيقاظ وأمثلة لها 

كلمة التنبيه هي كلمة أو عبارة محددة مثل "Hey Siri" و "Okay Google" و "Alexa" ؛ مصمم لتنشيط جهاز يتم تنشيطه صوتيًا للاستجابة عند نطقه. ومع ذلك ، فإن كلمة التنبيه التي يتم الاستماع إليها دائمًا والمدمجة محليًا مع الجهاز تقلل من وقت الاستجابة بشكل كبير وتزيد من دقة تحديد ومعالجة كلمة التنبيه حتى بدون اتصال بالإنترنت.

كيف يمكن أن يساعد Shaip؟

مع عروض Shaip للتدريب على كلمات الاستيقاظ دائمًا ، يتم ضبط نماذج المساعد الصوتي دائمًا للاستماع إلى كلمة التنبيه ، ولكن دون تسجيل البيانات أو نقلها فعليًا إلى السحابة. تمنحك الشراكة مع Shaip ميزة العمل مع الخبراء. من خلال خبرتنا الواسعة في استخدام تقنية الذكاء الاصطناعي والتعلم الآلي في تطوير تدريب المساعد الصوتي ، نساعدك على التخلص من مخاطر الخصوصية وتحسين تجربة المستخدم وتقليل تكاليف التطوير وتعزيز قابلية التوسع.

مجموعة نطق النص

نصائح قيّمة حول كيفية اختيار كلمات الإيقاظ المناسبة / كلمات الزناد

اختر الكلمات ذات الأصوات المتنوعة

تنشئ الأصوات المختلفة عمومًا توقيعًا أكثر تميزًا وتضمن دقة أفضل في النتائج. ومن ثم ، اختر عبارات في بياناتك تنتج أصواتًا مختلفة.

الاستفادة من بادئة مناسبة لكلماتك

اجعل كلمات التنبيه أكثر فاعلية من خلال إلصاقها ببادئات مثل "مرحبًا" أو "مرحبًا" أو "مرحبًا" أو "موافق". سيحافظ على كلمة التنبيه غير غامضة ويضمن عدم حدوث مطابقة عرضية عند استخدام الكلمة المشغلة في الكلام العادي.

استخدام الصوتيات لبناء الكلمات الزناد الخاصة بك

اجعل كلمات الاستيقاظ الخاصة بك مزيجًا من ستة أصوات على الأقل يمكن تمييزها بسهولة بواسطة آلة ويسهل على البشر نطقها. على سبيل المثال ، يحتوي "Alexa" على ستة فينومات بينما يحتوي "Ok Google" على ثمانية فينومات.

تجنب استخدام كلمة واحدة

لا تخطئ في استخدام كلمة واحدة ككلمة إيقاظ. يجب أن تكون كلمات الاستيقاظ طويلة بما يكفي لتكون مميزة.

كلمات بسيطة وفريدة من نوعها

تأكد من أن الكلمات المحفزة التي تقوم بإنشائها يجب أن تكون بسيطة وفريدة من نوعها بحيث يمكن تذكرها بسهولة.

تجنب الجمل الطويلة

يصعب نطق عبارات التنبيه المتعددة الكلمات الأطول وتجعل العملية أكثر صعوبة بلا داع.

حدود بيانات التدريب على Wake Word

الارتباك بسبب استخدام الألفاظ المتعددة

يتم تدريب نموذج كلمة التنبيه بشكل عام على التعرف على "لا". من أقوال مختلفة ، بحيث يمكن أن تستجيب للدعوات المختلفة. ومع ذلك ، فإن وجود عدد كبير جدًا من كلمات التنبيه المميزة يمكن أن يؤدي ببساطة إلى تنشيط مسار الكلام دون معرفة الكلام الذي تحدثه المستخدم.

نتائج أقل دقة بسبب المحيط الخارجي

تعمل عوامل مثل الضوضاء والمسافة والاختلافات في اللكنات واللغة على جعل الكشف الدقيق للكلمات المهمة أكثر صعوبة وتعقيدًا لنموذج الذكاء الاصطناعي الخاص بك.

بناء كلمات تنبيه دقيقة لعلامتك التجارية

قطار قطار

تساعدنا تجربتنا في تقنية الصوت على تطوير كلمات تنبيه مخصصة دائمًا للاستماع وعبارات تنبيه ذات علامة تجارية بسرعة. مع التعرف على الصوت جنبًا إلى جنب مع فهم معالجة اللغة الطبيعية ، تساعد خوارزميات ML في نسخ الكلام وتنفيذ الأوامر الصوتية بشكل فعال.

تطوير
تطوير

نحن نركز على التطوير السريع للنماذج الأولية لكلمة التنبيه لضمان تخصيص الكلمة ذات العلامة التجارية. يعمل النموذج الأولي كدليل على المفهوم ويساعد في التدريب الدقيق ، ووقت أسرع للتسويق ، والاختبار المعجل ، والقضاء على المخاطر.

النمو النمو

تمتع بتجربة نمو متواصل وتفاعل مع العملاء دون عوائق مع مساعد صوت استثنائي. نحن نقدم إمكانات التعرف على الكلام بلغات متعددة حتى يتمكن التطبيق من تحديد الكلمات والعبارات بدقة حتى في البيئات عالية الضوضاء.

تصميم وتطوير ونشر سريع

لا يلزم أن يكون التدريب ، والتطوير ، ونشر كلمات التنبيه المخصصة التي تستمع دائمًا ، مملة وتستغرق وقتًا طويلاً. مع المساعدة المناسبة من خبراء التكنولوجيا الخبراء في Shaip ، يمكنك تبسيط وتقليل الوقت اللازم للتسويق بشكل فعال. بالإضافة إلى ذلك ، تعمل تجربة جمع البيانات ووضع العلامات والتعليقات التوضيحية لصالحك لتقديم كلمات التنبيه في غضون أسابيع.

ميزات التدريب على كلمات الاستيقاظ ونشرها 

كلمات تنبيه العلامة التجارية المخصصة

كلمات تنبيه العلامة التجارية المخصصة

غالبًا ما ترتبط كلمة التنبيه ذات العلامات التجارية بالقيمة والأداء. لقد حان الوقت للاستفادة من الفوائد الهائلة المتمثلة في جعل كلمات التنبيه ذات العلامات التجارية المخصصة تعمل لصالحك. امتلك علامتك التجارية وقم بتطوير كلمة تنبيه مخصصة أو عبارة تعرض علامتك التجارية في أفضل صورة. في Shaip ، يمكننا مساعدة عملائك على استخدام اسم علامتك التجارية مع كل تفاعل مع تعويذة ذات علامة تجارية مع مساعديهم الصوتيين.

الأمر أو العبارات الإكتشاف

إن تجاوز كلمة التنبيه هو اكتشاف العبارة ، مما يسمح للمستخدمين باستخدام لغة طبيعية للتحكم في أجهزتهم التي يتم تنشيطها صوتيًا. يتمتع Shaip بخبرة واسعة في مساعدة الشركات الصغيرة والكبيرة على تطوير تطبيقات يمكنها معالجة عبارات طويلة بدون زمن انتقال ودقة متزايدة.

الأمر أو العبارات الإكتشاف
كشف العبارة المضمنة

اكتشاف الكلمة أو العبارة المضمنة

يساعد مطورو Shaip العلامات التجارية على توفير تجربة صوتية محسّنة لعملائهم من خلال توفير ميزة اكتشاف الكلمات الرئيسية أو العبارة. نحن نضمن الخصوصية ، وزمن انتقال صفري ، ودقة عالية من خلال جعل تقنية محرك كلمات التنبيه تعالج كلمات التنبيه المتعددة داخل المتصفح وليس على السحابة.

فهم مفهوم تنوع البيانات

ما هو تنوع البيانات؟

إنها طريقة لجمع بيانات المستخدم المهمة مثل هويتهم ، وبلدهم الأصلي ، وعمرهم ، وجنسهم ، ولغتهم ، ولكناتهم ، وما إلى ذلك. يُستخدم تنوع البيانات لتحسين الخوارزميات الموجهة للمستخدم لتحقيق نتائج أكثر دقة.

تميل البيانات عادة إلى توليد تحيزات داخلية. لذلك ، عندما نجمع البيانات من مصادر متنوعة ، يقل التحيز في النتائج بشكل كبير. 

فيما يلي بعض معلمات تنوع البيانات التي يتناولها Shaip أثناء إنشاء كلمات التنبيه وأوامر المحادثة الأخرى.

تنوع البيانات
السلالة والعرقالهندوس والمسلمون والمسيحيون والأفريكانيون والأوروبيون
مستوى التعليمجامعي ، خريج ، دكتوراه ، ماجستير
الدولةالصين ، اليابان ، الهند ، كوريا ، دبي ، نيجيريا ، الولايات المتحدة الأمريكية ، كندا
الجنسذكر، انثى
العمرأقل من 10 سنوات ، 10-15 ، 15-25 ، 25-45 ، 45 سنة فما فوق
اللغة الإنجليزية واليابانية والتركية والصينية والتايلاندية والهندية
البيئةصامت ، صاخب ، موسيقى خلفية ، صوت أو كلام في الخلفية ، داخلي ، خارجي ، مسرح ، استاد ، كافيتريا ، في السيارة ، مكتب ، مركز تسوق ، ضجيج منزلي ، درج ، شارع / طريق ، جانب البحر (عاصف)
لهجات (الإنجليزية)الإنجليزية الاسكتلندية ، الإنجليزية الويلزية ، الإنجليزية الهبرنو ، الإنجليزية الكندية ، الإنجليزية الأسترالية ، الإنجليزية النيوزيلندية.
أسلوب التحدثسرعة سريعة / عادية / بطيئة ، حجم مرتفع / عادي / ناعم ، رسمي / غير رسمي ، إلخ.
مواقع الجهازمحمول ، سطح المكتب

حالات الاستخدام الرئيسية

البحث الصوتي

أضف البحث الصوتي إلى تطبيقات الجوال ومواقع الويب والأجهزة. ابحث عن كلمات رئيسية وعبارات في الصوت والفيديو والتدفقات.

بحث بدون استخدام اليدين

قم بتمكين برنامجك من تقديم نتائج بحث بدون استخدام اليدين مع الاستفادة من الأوامر الصوتية لإكمال الإجراء المقصود.

اوامر صوتية

أضف أوامر صوتية إلى الأجهزة أو تطبيقات الجوال أو الويب من أجل الارتقاء بتجربة العميل.

تحليلات الكلام

تعمل منصة Voice AI الشاملة على تشغيل البرنامج بأدوات ذكية لتوفير تجربة عملاء استثنائية.

لماذا شيب

لنشر مبادرة الذكاء الاصطناعي الخاصة بك بشكل فعال ، ستحتاج إلى كميات كبيرة من مجموعات بيانات التدريب المتخصصة. Shaip هي واحدة من الشركات القليلة جدًا في السوق التي تضمن بيانات تدريب موثوقة وذات مستوى عالمي على نطاق واسع بما يتوافق مع المتطلبات التنظيمية / اللائحة العامة لحماية البيانات.

قدرات جمع البيانات

قم بإنشاء وتنظيم وجمع مجموعات بيانات مخصصة (نص ، كلام ، صورة ، فيديو) من أكثر من 100 دولة في جميع أنحاء العالم بناءً على إرشادات مخصصة.

قوة عاملة مرنة

استفد من قوتنا العاملة العالمية التي تضم أكثر من 30,000 مساهم من ذوي الخبرة والمعتمدين. تخصيص المهام المرن وقدرة القوى العاملة في الوقت الفعلي والكفاءة ومراقبة التقدم.

الجودة

تستخدم منصتنا الخاصة والقوى العاملة الماهرة لدينا طرقًا متعددة لمراقبة الجودة لتلبية أو تجاوز معايير الجودة المحددة لجمع مجموعات بيانات تدريب الذكاء الاصطناعي.

متنوعة ودقيقة وسريعة

تبسط عمليتنا ، وعملية التجميع من خلال توزيع المهام وإدارتها وتجميع البيانات بشكل أسهل مباشرة من واجهة التطبيق والويب.

حماية البيانات

الحفاظ على سرية البيانات الكاملة من خلال جعل الخصوصية أولويتنا. نحن نضمن أن تنسيقات البيانات تخضع لرقابة السياسة والمحافظة عليها.

خصوصية المجال

البيانات المنسقة الخاصة بالمجال والتي تم جمعها من مصادر خاصة بالصناعة بناءً على إرشادات جمع بيانات العملاء.

استخدام الذكاء الاصطناعي لتحسين أداء الأعمال من خلال تجربة العملاء

كلمات التنبيه هي العبارات التي تنشط الأنظمة التي تدعم الصوت وتضعها في وضع الاستماع لأخذ التعليمات من المستخدمين.

اسم الاحتجاج هو الكلمة الأساسية المستخدمة لإطلاق "مهارة" معينة من البرنامج. يمكن أن يكون اسم الاستدعاء أيضًا أسماء أشخاص أو أماكن ويمكن دمجه مع إجراء أو أمر أو سؤال. يجب أن يكون لجميع المهارات المخصصة اسم استدعاء لبدء تشغيلها.

الألفاظ هي عبارات يستخدمها المستخدمون لتقديم طلب لبرنامج الأوامر الصوتية الخاص بك. يحدد البرنامج نية المستخدم من الكلام المعطى ويستجيب وفقًا لذلك.

معالجة اللغة الطبيعية أو البرمجة اللغوية العصبية (NLP) هي تقارب بين الذكاء الاصطناعي واللغويات الحاسوبية المسؤولة عن التفاعلات بين الآلات واللغات الطبيعية للإنسان. الاستفادة من خوارزميات البرمجة اللغوية العصبية ، يقوم البرنامج بتحليل أو فهم أو تغيير أو إنشاء لغة طبيعية لنموذج الذكاء الاصطناعي الخاص بك.

استيقظ الكلمة ، الأقوال ، كلمات الزناد ، الكلمات الساخنة ، كلمات الدعاء

 الجملة هي مجموعة من الكلمات التي تعبر عن المعنى الكامل أو تنقل فكرة كاملة. يمكن أن تكون الجملة بسيطة أو معقدة أو مركبة بطبيعتها ، ويمكن التعبير عنها بصيغة مكتوبة أو منطوقة. 

من ناحية أخرى ، فإن الكلام هو وحدة الكلام التي لا تنقل عادةً المعنى أو الفكر بالكامل ، وهي مليئة بالتوقفات والصمت.

أمثلة على الأقوال: 

  1. "دعني أقدم لكم ... هذه هي الإحصائيات في المنطقة"
  2. "أرني أحدث فيلم …… الذي تم إصداره الأسبوع الماضي."
  3. "هل المتجر الموجود في شارع 22 مفتوح الآن …… المتجر المجاور للبنك."

يأتي Alexa مزودًا بالعديد من الميكروفونات المدمجة التي تكتشف وتتعرف على كلمة التنبيه من خلال تجاهل ضوضاء الخلفية. لمنع السلبيات الخاطئة والإيجابيات الخاطئة ، تمت برمجة Alexa لتشغيل السمع فقط بعد اكتشاف كلمة التنبيه "Alexa".

كلمة التنبيه هي أي عبارة مبرمجة تجعل مساعد الكلام يبدأ في الاستماع إلى طلبات المستخدم ومعالجتها. يتم تدريب أي مساعد كلام على تفاعلات العالم الحقيقي باستخدام الذكاء الاصطناعي ومعالجة اللغة الطبيعية حيث يتم تحويل الكلام إلى عبارات وكلمات وأصوات.