دراسة حالة: مجموعة الكلام

تسليم 7 مليون كلمة + كلمة لبناء مساعدين رقميين متعددي اللغات بـ 13 لغة

حل العالم الحقيقي

البيانات التي تدعم المحادثات العالمية

تنشأ الحاجة إلى التدريب على الكلام لأنه لا يستخدم جميع العملاء الكلمات أو العبارات الدقيقة أثناء التفاعل أو طرح الأسئلة على المساعدين الصوتيين بتنسيق نصي. لهذا السبب يجب تدريب تطبيقات صوتية معينة على بيانات الكلام التلقائية. على سبيل المثال ، "أين يقع أقرب مستشفى؟" "ابحث عن مستشفى بالقرب مني" أو "هل توجد مستشفى قريبة؟" تشير جميعها إلى نفس القصد من البحث ولكن يتم صياغتها بشكل مختلف.

المشكلة

لتنفيذ خارطة طريق الكلام الخاصة بالمساعد الرقمي للعملاء للغات في جميع أنحاء العالم ، كان الفريق بحاجة إلى الحصول على كميات كبيرة من بيانات التدريب لنموذج الذكاء الاصطناعي للتعرف على الكلام. المتطلبات الأساسية للعميل هي:

الحصول على كميات كبيرة من بيانات التدريب (مطالبات نطق المتحدث الفردي لا تزيد عن 3-30 ثانية) لخدمات التعرف على الكلام في 13 لغة عالمية
لكل لغة ، سيُنشئ المورد مطالبات نصية للمتحدثين للتسجيل (ما لم يكن ملف
إمدادات العميل) ونسخ الصوت الناتج.
توفير البيانات الصوتية ونسخ الكلام المسجل مع ملفات JSON المقابلة
تحتوي على البيانات الوصفية لجميع التسجيلات.
ضمان مزيج متنوع من المتحدثين حسب العمر والجنس والتعليم واللهجة
ضمان مزيج متنوع من بيئات التسجيل وفقًا للمواصفات.
يجب أن يكون كل تسجيل صوتي 16 كيلو هرتز على الأقل ولكن يفضل 44 كيلو هرتز

تسريع الذكاء الاصطناعي للمحادثة
تطوير التطبيقات بنسبة 100٪

"بعد تقييم العديد من البائعين ، اختار العميل Shaip بسبب خبرتهم في مشاريع الذكاء الاصطناعي للمحادثة. لقد أعجبنا بكفاءة شيب في تنفيذ المشروع ، وخبراتهم في الحصول على الكلام المطلوب من اللغويين الخبراء ونسخه وتقديمه في 13 لغة ضمن جداول زمنية صارمة وبالنوعية المطلوبة "

الحلول

من خلال فهمنا العميق للذكاء الاصطناعي للمحادثات ، ساعدنا العميل على جمع البيانات وتدوينها والتعليق عليها مع فريق من اللغويين الخبراء والمعلقين لتدريب مجموعة الصوت متعددة اللغات الخاصة بمعالجة الكلام المدعومة بالذكاء الاصطناعي.

شمل نطاق عمل Shaip ، على سبيل المثال لا الحصر ، الحصول على كميات كبيرة من بيانات التدريب الصوتي للتعرف على الكلام ، ونسخ التسجيلات الصوتية بلغات متعددة لجميع اللغات على خارطة طريق المستوى 1 والمستوى 2 للغة ، وتقديم المقابلة. JSON الملفات التي تحتوي على البيانات الوصفية. قام Shaip بجمع أقوال من 3 إلى 30 ثانية على نطاق واسع مع الحفاظ على مستويات الجودة المطلوبة لتدريب نماذج ML للمشاريع المعقدة.

تم جمع الصوت ونسخه وتعليقه: 22,250 ساعه
اللغات المدعومة: 13 (الدانماركية ، والكورية ، والعربية السعودية ، والهولندية ، والبر الرئيسي وتايوان الصينية ، والفرنسية الكندية ، والإسبانية المكسيكية ، والتركية ، والهندية ، والبولندية ، واليابانية ، والروسية)
عدد الأقوال: شنومكسم +
الجدول الزمني: 7-8 أشهر

أثناء جمع النطق الصوتي عند 16 كيلوهرتز ، حرصنا على توفير مزيج صحي من مكبرات الصوت حسب العمر والجنس والتعليم واللهجات في بيئات تسجيل متنوعة.

نتيجة

مكنت البيانات الصوتية عالية الجودة من اللغويين الخبراء العميل من تدريب نموذج التعرف على الكلام متعدد اللغات بدقة في 13 لغة عالمية من المستوى 1 و 2. من خلال مجموعات بيانات التدريب ذات المعايير الذهبية ، يمكن للعميل تقديم مساعدة رقمية ذكية وقوية لحل مشاكل العالم الحقيقي في المستقبل.

خبرتنا

ساعات الكلام المجمعة

0 +

فريق جامعي البيانات الصوتية

متوافق مع PII

0 %

رقم رائع

0 +

قبول البيانات ودقتها

> 0

عملاء Fortune 500

0 +

الموارد الموصى بها

دليل المشتري

دليل المشتري: الذكاء الاصطناعي للمحادثة

يعمل برنامج chatbot الذي تحدثت معه على نظام AI للمحادثة المتقدم الذي يتم تدريبه واختباره وبنائه باستخدام العديد من مجموعات بيانات التعرف على الكلام.

المدونة

حالة الذكاء الاصطناعي للمحادثة 2021

تتحدث الرسوم البيانية للمحادثة AI 2021 عن ماهية الذكاء الاصطناعي للمحادثة ، وتطوره ، وأنواعه ، وسوق AI للمحادثة حسب المنطقة ، وحالات الاستخدام ، والتحديات ، وما إلى ذلك.

المدونة

3 معوقات تطور الذكاء الاصطناعي التخاطبي

تعمل Shaip على بدء تطور الذكاء الاصطناعي للمحادثة كأداة لمشاركة العملاء من خلال تقديم البيانات الصوتية المشروحة الضرورية بأكثر من 50 لغة.

يعد إنشاء البرمجة اللغوية العصبية السريرية مهمة حاسمة تتطلب خبرة مجال هائلة لحلها. أستطيع أن أرى بوضوح أنك تتقدم على Google بعدة سنوات في هذا المجال. أريد العمل معك وتوسيع نطاقك.

جوجل، شركة مدير المدارس

عمل فريقي الهندسي مع فريق Shaip لمدة تزيد عن عامين أثناء تطوير واجهات برمجة تطبيقات خطاب الرعاية الصحية. لقد أعجبنا بعملهم الذي تم إنجازه في معالجة اللغات الطبيعية الخاصة بالرعاية الصحية وما يمكنهم تحقيقه من خلال مجموعات البيانات المعقدة.

جوجل، شركة رئيس الهندسة

أخبرنا كيف يمكننا مساعدتك في مبادرتك التالية للذكاء الاصطناعي.

دراسة حالة: مجموعة الكلام

تسليم 7 مليون كلمة + كلمة لبناء مساعدين رقميين متعددي اللغات بـ 13 لغة

حل العالم الحقيقي

المشكلة

الحلول

نتيجة

خبرتنا

الموارد الموصى بها

دليل المشتري

دليل المشتري: الذكاء الاصطناعي للمحادثة

المدونة

حالة الذكاء الاصطناعي للمحادثة 2021

المدونة

3 معوقات تطور الذكاء الاصطناعي التخاطبي

خدمات بيانات الذكاء الاصطناعي

خاصة

صناعة

المنتجات

الشركة

الموارد

تواصل معنا

دعنا نعرف المزيد عنك!

دعنا نعرف المزيد عنك!

دعنا نعرف المزيد عنك!

دعنا نعرف المزيد عنك!

دعنا نعرف المزيد عنك!

دعنا نعرف المزيد عنك!