خدمات جمع بيانات الكلام الأكثر موثوقية للذكاء الاصطناعي الخاص بك

قم بتدريب نماذج البرمجة اللغوية العصبية الخاصة بك ، و VAs ، ونماذج TTS ، والمزيد باستخدام بيانات محادثة عالية الجودة ، من خلال خدمات جمع بيانات الصوت والكلام لدينا

جمع البيانات الصوتية

اكتشف خطوط أنابيب البيانات الصوتية بدون اختناقات

عملاء متميزون

خدمات جمع البيانات الصوتية/الصوتية الاحترافية

اي موضوع. أي سيناريو.

في Shaip، تكمن خبرتنا في إنشاء مجموعات بيانات كلامية عالية الجودة مصممة لتلبية متطلبات الذكاء الاصطناعي/التعلم الآلي المتنوعة. نحن نقدم مجموعة واسعة من اللغات ونسجل في إعدادات متنوعة مما يجعل مجموعات البيانات لدينا شاملة وقابلة للتكيف. ياينصب تركيزك على تغذية النماذج بأكبر حجم من بيانات الكلام المخصصة، في أقل وقت ممكن. معنا على متن الطائرة، يمكنك أن تتوقع: 

جمع الكلام
  • بيانات صوتية/صوتية متعددة اللغات منسقة عالية الجودة لتحسين الدقة
  • أعلى مستوى ممكن من خصوصية المجال لtاستهدف سيناريو متنوعًا الإعداد
  •  قم بتوسيع نموذج ML الخاص بك ليناسب التركيبة السكانية والقطاعات المتنوعة
  • بيئات التسجيل: جودة الاستوديو, تتميز بصوت واضح للغاية مع الحد الأدنى من الضوضاء في الخلفية، & البيئات الطبيعية، حيث تتضمن التسجيلات الأصوات المحيطة لتقليد مواقف العالم الحقيقي.

+100

البلدان

55K +

ساعات بيانات الكلام

+250

المشاريع

+60

اللغات (+100 لهجة)

8 / 16 / 44 / 48 كيلو هرتز

معدل أخذ العينات

خبرتنا

قم بمحاذاة البيانات الصوتية لنماذج البرمجة اللغوية العصبية الأكثر ذكاءً

تقدم Shaip خدمات جمع بيانات الصوت / الكلام من طرف إلى طرف بأكثر من 100 لغة لتمكين التقنيات التي تدعم الصوت لتلبية مجموعة متنوعة من الجماهير في جميع أنحاء العالم. يمكننا العمل في مشاريع من أي نطاق وحجم ؛ من ترخيص مجموعات البيانات الصوتية الجاهزة إلى إدارة جمع البيانات الصوتية المخصصة إلى النسخ الصوتي والتعليقات التوضيحية. بغض النظر عن حجم مشروع جمع بيانات الكلام الخاص بك ، يمكننا تخصيص خدمات جمع الصوت لتناسب احتياجاتك لبناء مجموعات بيانات NLP عالية الجودة تستهدف اللهجات والنغمات واللغات. اختر من بين مجموعتنا الواسعة من مجموعات البيانات الكلامية وموارد جمع البيانات الصوتية ، لإعدادات تمكين الصوت الذكية.

خطاب المونولوج

مجموعة الكلام مناجاة

وهو يركز على معالجة الكلام من متحدث واحد. استخدم المطالبات المكتوبة لتغذية الملفات الصوتية ذات القناة الواحدة، مما يضمن التقاط أنماط الكلام الفريدة والنغمات والفروق الدقيقة الخاصة بهذا الفرد.

خطاب الحوار

خطاب الحوار
مجموعة

التفاعل بين شخصين، وتكرار المحادثات والحوارات الواقعية مع التعرض متعدد اللغات عبر ملفات ثنائية القناة والموارد المكتوبة.

محادثات متعددة الأطراف

مجموعة / حزب المعطي
المحادثات

مناقشات متعددة الأشخاص، والتقاط ديناميكيات المجموعة، والتداخلات، والنغمات المتنوعة لتدريب نماذج الكلام بدقة.

نطق اللغة الطبيعية

مجموعة نطق اللغة الطبيعية

تدريب الذكاء الاصطناعي على تحديد العبارات أو تنبيه الكلمات ذات المعاني المتشابهة باستخدام ألفاظ متنوعة وغنية وحقيقية لمعالجة وفهم اللغة الطبيعية المتقدمة.

الكلام الصوتي

البيانات الصوتية
مجموعة

يمكننا تسجيل بيانات صوتية بجودة الاستوديو بشكل احترافي سواء كانت تلك البيانات من مطاعم أو مكاتب أو منازل أو من بيئات ولغات مختلفة، مع تغطية نطاق صوتي أوسع (مجموعات بيانات الصوت الشاملة).

التعرف التلقائي على الكلام

التعرف التلقائي على الكلام (ASR)

قم بتحسين دقة أنظمة التعرف التلقائي على الكلام (ASR) من خلال الوصول إلى أحدث مجموعات بيانات الصوت / الكلام المتنوعة ، من مجموعة واسعة من الديموغرافيات.

نطق اللغة الطبيعية

بيانات التدريب على الكلام / الصوت متعدد اللغات

يقدم متخصصو اللغات المهرة لدينا، في جميع أنحاء العالم، بيانات صوتية/كلامية متعددة اللغات بلغات ولهجات مختلفة. ويعزز هذا الجهد التواصل العالمي ويزيل الحواجز اللغوية، مما يساهم في إيجاد حلول أكثر شمولاً وفعالية للذكاء الاصطناعي.

المساعدين الافتراضيين الرقميين

النص إلى كلام
(تحويل النص إلى كلام)

أنشئ نموذجًا متعدد اللغات لتحويل النص إلى كلام (TTS) بمساعدة القوى العاملة العالمية لدينا، التي تساعدك على جمع بيانات الكلام بأكثر من 150 لغة ولهجة لتعزيز نماذج الذكاء الاصطناعي الخاصة بك بدءًا من أدوات التحكم داخل السيارة وحتى روبوتات الدردشة وحلول التعلم عالية الجودة بيانات صوتية عالية الجودة.

تسجيلات مركز الاتصال

مركز الاتصال
التسجيلات

تبادلات حقيقية بين الوكلاء والعملاء، ودعم العديد من اللغات مثل الإسبانية والألمانية والإنجليزية الأمريكية والبنغالية واليابانية والصينية والهندية.

قصص نجاح

مجموعات بيانات الذكاء الاصطناعي للمحادثة مع أكثر من 3 آلاف ساعة من البيانات عبر 8 لغات

سعيًا لبناء منصة متعددة اللغات للغات الهندية، دخل العميل في شراكة مع Shaip لجمع مجموعات كبيرة من البيانات وتقسيمها ونسخها بلغات هندية متعددة. وهذا من شأنه أن يساعد في تطوير نماذج خطاب فعالة يمكنها تشغيل النظام الأساسي الجديد المبتكر للعميل.

المشكلة: تم جمع أكثر من 3,000 ساعة من البيانات الصوتية بثماني لغات هندية، وتم تقسيمها ونسخها لتطوير التعرف التلقائي على الكلام.

حل: لقد قدمنا ​​جمع البيانات وتقسيمها ونسخها وتسليم ملفات JSON مع البيانات الوصفية. لقد جمعنا 3000 ساعة من البيانات الصوتية بـ 8 لغات هندية على نطاق واسع لمشروع تكنولوجيا الكلام الخاص بالعميل.

دراسة حالة جمع بيانات الكلام

أسباب اختيار Shaip كشريك جدير بالثقة في جمع بيانات الكلام

مجتمع

مجتمع

فرق متخصصة ومدربة:

  • أكثر من 30,000 متعاون لإنشاء البيانات ووضع العلامات وضمان الجودة
  • فريق إدارة المشروع المعتمد
  • فريق تطوير المنتجات من ذوي الخبرة
  • فريق تحديد مصادر المواهب والإعداد
المعالجة:

المعالجة:

يتم ضمان أعلى كفاءة للعملية من خلال:

  • عملية بوابة المرحلة القوية 6 سيجما
  • فريق متخصص من 6 أحزمة سوداء سيجما - أصحاب العمليات الرئيسية والامتثال للجودة
  • حلقة التحسين المستمر وردود الفعل
الانطلاق

الانطلاق

تقدم المنصة الحاصلة على براءة اختراع فوائد:

  • منصة قائمة على الويب من طرف إلى طرف
  • جودة لا تشوبها شائبة
  • أسرع TAT
  • تسليم سلس

مجموعات البيانات الصوتية / الكلام غير الجاهز

التفاصيلمجموعة بيانات اللغةمعدل العينةنوع مجموعة البياناتإجمالي ساعات الصوتوصف قصيروصف مجموعة البياناتقناة الصوتمنصة التسجيلWER (٪)تنسيق الصوتتنسيق النسخاستخدام القضيةعدد مكبرات الصوتCTA
خطابar_US_CC_8الأمريكية الأفريقية العاميةالأمريكية الأفريقية العاميةen_US8 كيلو هرتزمركز الاتصال211بيانات مركز الاتصال العامية الأمريكية الأفريقيةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 612 ، ذكر: 1242 ، غير معروف: 12
خطابar_US_MA_16الأمريكية الأفريقية العاميةالأمريكية الأفريقية العاميةen_US16 كيلو هرتزالوسائط السمعية154بيانات وسائل الإعلام الأمريكية الأفريقيةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 151 ، ذكر: 150 ، غير معروف: 10
خطابالأفريكانية_GC_8الأفريكانيةالأفريكانيةaf_ZA8 كيلو هرتزمحادثة عامة368بيانات المحادثة العامة باللغة الأفريكانيةمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، يتم التحدث باللغة الأفريكانية في إفريقيامزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 502 ، ذكر: 390 ، غير معروف: 2
خطاباللغة الأفريكانية_MA_16الأفريكانيةالأفريكانيةaf_ZA16 كيلو هرتزالوسائط السمعية658ملفات الوسائط باللغة الأفريكانيةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 750 ، ذكر: 1278 ، غير معروف: 52
خطابالعربية_GC_8العربيهالعربيهar_AE8 كيلو هرتزمحادثة عامة292بيانات المحادثة العامة باللغة العربيةمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، العربية من دول الخليجمزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 171 ، ذكر: 534 ، غير معروف: 1
خطابعربي_SM_48العربيهالعربيهAR-SA48 كيلو هرتزمناجاة مكتوبة1,947مناجاة مكتوبة باللغة العربيةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 838 ذكر 1209 غير معروف 78
خطابالأسامية_CC_8الأساميةالأسامية (في خط الأنابيب) as_INمركز الاتصال60بيانات مركز الاتصال الأسامية (في خط الأنابيب)محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابAssamese_GCالأساميةالأسامية (في خط الأنابيب) as_INمحادثة عامة100أساميز (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالأسامية_MAالأساميةالأسامية (في خط الأنابيب) as_INالوسائط السمعية40البيانات الصوتية للوسائط الأسامية (في خط الأنابيب)ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالبنغالية _CC_8البنغاليةالبنغالية (في خط الأنابيب) bn_INمركز الاتصال60بيانات مركز الاتصال البنغالية (في خط الأنابيب)محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالبنغاليةالبنغاليةالبنغالية (في خط الأنابيب) bn_INمحادثة عامة100البنغالية (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالبنغاليةالبنغاليةالبنغالية (في خط الأنابيب) bn_INالوسائط السمعية40البيانات الصوتية للوسائط البنغالية (في خط الأنابيب)ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطاببوسطن_CC_8بوسطن الإنجليزيةبوسطن الإنجليزيةen_US8 كيلو هرتزمركز الاتصال177بيانات مركز اتصال بوسطنمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 605 ، ذكر: 711 ، غير معروف: 0
خطاببوسطن_GC_8بوسطن الإنجليزيةبوسطن الإنجليزيةen_US8 كيلو هرتزمحادثة عامة32بيانات المحادثة العامة في بوسطنمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 53 ، ذكر: 83 ، غير معروف: 0
خطاببوسطن_MA_16بوسطن الإنجليزيةبوسطن الإنجليزيةen_US16 كيلو هرتزالوسائط السمعية93بيانات الصوت بوسطن ميدياملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 43 ، ذكر: 181 ، غير معروف: 2
خطابالكندية_SM_48الكندية الفرنسيةالكندية الفرنسيةالاب-CA48 كيلو هرتزمناجاة مكتوبة1,222الكندية الفرنسيةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 974 ذكر 631 غير معروف 1
خطابالصينية_CC_8الصينية الإنجليزيةالصينية الإنجليزيةen_US8 كيلو هرتزمركز الاتصال169بيانات مركز الاتصال الصينيمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 1790 ، ذكر: 523 ومجهول: 13
خطابالصينية_MA_16الصينية الإنجليزيةالصينية الإنجليزيةen_US16 كيلو هرتزالوسائط السمعية249بيانات صوت الوسائط الصينيةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 126 ، ذكر: 346 ومجهول: 6
خطابالصينية المبسطة SM_48الصينية المبسطةالصينية المبسطةزكية-CN48 كيلو هرتزمناجاة مكتوبة2,762الصينية المبسطةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1920 ذكر 1535 غير معروف 270
خطابالصينية Traditional_SM_48الصينية التقليديةالصينية التقليديةzh-TW48 كيلو هرتزمناجاة مكتوبة1,028الصينية التقليديةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1069 ذكر 262 غير معروف 3
خطابالدنماركية_GC_8الدانماركيةالدانماركيةda_DK8 كيلو هرتزمحادثة عامة372بيانات المحادثة العامة الدنماركيةمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 311، ذكر: 417، غير معروف: 0
خطابالدنماركية_MA_16الدانماركيةالدانماركيةda_DK16 كيلو هرتزالوسائط السمعية664بيانات صوت الوسائط الدنماركيةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى: 369، ذكر: 864، غير معروف: 27
خطابالدنماركية_SM_48الدانماركيةالدانماركيةدا-DK48 كيلو هرتزمناجاة مكتوبة2,579مناجاة الدنماركية المكتوبةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية ، الدنماركية من الدنماركبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1551 ذكر 1233 غير معروف 42
خطابالإنجليزية العميقة الجنوبية_CC_8إنجليش ديب ساوثإنجليش ديب ساوثen_US8 كيلو هرتزمركز الاتصال151بيانات مركز الاتصال في الجنوب العميقمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 221 ، ذكر 1004 ، غير معروف 7
خطابالإنجليزية ديب South_GC_8إنجليش ديب ساوثإنجليش ديب ساوثen_US8 كيلو هرتزمحادثة عامة56بيانات المحادثة العامة باللغة الإنجليزية في الجنوب العميقمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة99 أنثى 31 ذكر غير معروف 0
خطابإنجليش ديب South_MA_16إنجليش ديب ساوثإنجليش ديب ساوثen_US16 كيلو هرتزالوسائط السمعية266بيانات الصوت الإنجليزية Deep South Mediaملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة204 أنثى 356 ذكر غير معروف 21
خطابالألمانية_CC_8الألمانيّةالألمانيّةدي دي8 كيلو هرتزمركز الاتصال64بيانات مركز الاتصال الألماني محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،بالأبيض والأسودالحاسوب. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 478 ذكر 1440 غير معروف 0
خطابالألمانية_IVR_8الألمانيّةالألمانيّةدي دي8 كيلو هرتز IVR200بيانات IVR الألمانيةإنسان لآلة. نوع تدفق IVR حيث يوجد موجه TTS (على سبيل المثال "كيف يمكنني مساعدتك") متبوعًا باستجابة بشرية عفويةبالأبيض والأسودالحاسوب. الرعايا .jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة أنثى 10115 ذكر 8750 غير معروف 0
خطابالغوجاراتية_CC_8الغوجاراتيةالغوجاراتية (في خط الأنابيب) gu_INمركز الاتصال60بيانات مركز الاتصال الغوجاراتية (في خط الأنابيب)محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالغوجاراتية_GCالغوجاراتيةالغوجاراتية (في خط الأنابيب) gu_INمحادثة عامة100الغوجاراتية (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالغوجاراتية_MAالغوجاراتيةالغوجاراتية (في خط الأنابيب) gu_INالوسائط السمعية40بيانات صوت الوسائط الغوجاراتية (في خط الأنابيب)ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالعبرية_المحادثة العامة_8العبريةالعبريةهو_IL8 كيلو هرتزمحادثة عامة399بيانات المحادثة العامة العبريةمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، العبرية في إسرائيلمزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 414 ، ذكر 399 ، غير معروف 1
خطابالعبرية_MA_16العبريةالعبريةهو_IL16 كيلو هرتزالوسائط السمعية427البيانات الصوتية لوسائل الإعلام العبريةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 361 ، ذكر 513 ، غير معروف 13
خطابالهندية_MA_16الهنديةالهنديةمرحبا في16 كيلو هرتزالوسائط السمعية219بيانات الصوت الهندية للوسائطملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 83 ، ذكر 309 ، غير معروف 0
خطابالهندية_SM_48الهنديةالهنديةمرحبا في48 كيلو هرتزمناجاة مكتوبة2,867مناجاة هندية مكتوبةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1977 ذكر 1864 غير معروف 147
خطابHINGLISH_CC_8هنجليزيةهنجليزيةhg_IN8 كيلو هرتزمركز الاتصال208بيانات مركز الاتصال المعلقةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 822 ذكر 1262 غير معروف 0
خطابHINGLISH_MA_16هنجليزيةهنجليزيةhg_IN16 كيلو هرتزالوسائط السمعية216HINGLISH بيانات صوت الوسائطملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة75 ذكر 380 غير معروف 0
خطاباسباني_CC_8الإنجليزية الإسبانيةالإنجليزية الإسبانيةen_US8 كيلو هرتزمركز الاتصال212بيانات مركز الاتصال من أصل اسبانيمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 822 ذكر 1262 غير معروف 0
خطاباسباني_MA_16الإنجليزية الإسبانيةالإنجليزية الإسبانيةen_US16 كيلو هرتزالوسائط السمعية155صوت من أصل اسباني نداء ميدياملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 140 ذكر 219 غير معروف 5
خطابالأندونيسية_GC_8الأندونيسيةالأندونيسيةفعلت8 كيلو هرتزمحادثة عامة496بيانات المحادثة العامة الإندونيسيةمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، البهاسا الإندونيسيةمزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 524 ذكر 454 غير معروف 2
خطابالأندونيسية_MA_16الأندونيسيةالأندونيسيةفعلت16 كيلو هرتزالوسائط السمعية643بيانات صوت الوسائط الإندونيسيةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 746 ذكر 1507 غير معروف 129
خطابالأيرلندية_GC_8الأيرلنديةالأيرلنديةar_IE8 كيلو هرتزمحادثة عامة192بيانات المحادثة العامة الأيرلنديةمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 213 ، ذكر 153 ، غير معروف 0
خطاباليابانية_SM_48اليابانيّةاليابانيّةجا-JP48 كيلو هرتزمناجاة مكتوبة2,335مناجاة يابانية مكتوبةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1460 ذكر 1221 غير معروف 194
خطابالكانادا_CC_8الكاناداالكانادا (في خط الأنابيب) kn_INمركز الاتصال60الكانادا (في خط الأنابيب) بيانات مركز الاتصالمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالكانادا_GCالكاناداالكانادا (في خط الأنابيب) kn_INمحادثة عامة100الكانادا (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالكانادا_MAالكاناداالكانادا (في خط الأنابيب) kn_INالوسائط السمعية40الكانادا (في خط الأنابيب) بيانات صوت الوسائطملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالكورية_CC_8الكوريّةالكوريّةko_KR8 كيلو هرتزمركز الاتصال107بيانات مركز الاتصال الكوريمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1086 ذكر 210 غير معروف 4
خطابكوري_ما_16الكوريّةالكوريّةko_KR16 كيلو هرتزالوسائط السمعية204بيانات صوت الوسائط الكوريةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 70 ذكر 303 غير معروف 25
خطابكوري_SM_48الكوريّةالكوريّةكو-KR48 كيلو هرتزمناجاة مكتوبة1,955مناجاة نصية كوريةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1195 ذكر 1134 غير معروف 122
خطابالماليزية_GC_8الملايويةالملايويةms_MY8 كيلو هرتزمحادثة عامة266بيانات المحادثة العامة الملايومحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، الملايو في ماليزيامزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 316 ، ذكر 176 ، غير معروف 0
خطابالملايو MA_16الملايويةالملايويةms_MY16 كيلو هرتزالوسائط السمعية344بيانات الصوت الملايو ميدياملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة236 أنثى 626 ذكر غير معروف 47
خطابالمالايالامية_CC_8المالايالاميةالمالايالامية (في خط الأنابيب) ml_INمركز الاتصال60المالايالامية (في خط الأنابيب) بيانات مركز الاتصالمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابمالايالام جالمالايالاميةالمالايالامية (في خط الأنابيب) ml_INمحادثة عامة100المالايالامية (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالمالايالاميةالمالايالاميةالمالايالامية (في خط الأنابيب) ml_INالوسائط السمعية40المالايالامية (في خط الأنابيب) بيانات صوت الوسائطملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالمهاراتيةالمراتيةالمهاراتية (في خط الأنابيب) السيد_INمركز الاتصال60الماراثية (في خط الأنابيب) بيانات مركز الاتصالمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابMarathi_GCالمراتيةالمهاراتية (في خط الأنابيب) السيد_INمحادثة عامة100المهاراتية (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالمهاراتيةالمراتيةالمهاراتية (في خط الأنابيب) السيد_INالوسائط السمعية40البيانات الصوتية للوسائط الماراثية (في خط الأنابيب)ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالمكسيكي_SM_48الإسبانية (المكسيك)الإسبانية (المكسيك)ES-MX48 كيلو هرتزمناجاة مكتوبة1,492مونولوج مكسيكي إسباني مكتوبالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1016 ذكر 1069 غير معروف 95
خطابهولندا_SM_48الهولنديةالهولنديةEN-GB48 كيلو هرتزمناجاة مكتوبة1,205مناجاة نصية هولنديةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1285 ذكر 531 غير معروف 3
خطابنيويورك English_CC_8نيويورك الإنجليزيةنيويورك الإنجليزيةen_US8 كيلو هرتزمركز الاتصال103بيانات مركز الاتصال باللغة الإنجليزية في نيويوركمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 610 ، ذكر 532 ، غير معروف 0
خطابنيويورك English_GC_8نيويورك الإنجليزيةنيويورك الإنجليزيةen_US8 كيلو هرتزمحادثة عامة107بيانات المحادثة العامة باللغة الإنجليزية في نيويوركمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 118 ذكر 114 غير معروف 0
خطابنيويورك English_MA_16نيويورك الإنجليزيةنيويورك الإنجليزيةen_US16 كيلو هرتزالوسائط السمعية140بيانات صوت New York English Mediaملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 66 ذكر 230 غير معروف 11
خطابنيوزيلندا_GC_8نيوزيلندا الإنجليزية نيوزيلندا الإنجليزية ar_NZ8 كيلو هرتزمحادثة عامة148نيوزيلندا الإنجليزية بيانات المحادثة العامةمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 167 ذكر 121 غير معروف 4
خطابنيوزيلندا_MA_16نيوزيلندا الإنجليزية نيوزيلندا الإنجليزية ar_NZ16 كيلو هرتزالوسائط السمعية400نيوزيلندا وسائل الإعلام الإنجليزية السمعيةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 367 ذكر 678 غير معروف 26
خطابأوريا_CC_8الأورياالأوريا (في خط الأنابيب) أو_INمركز الاتصال60أوريا (في خط الأنابيب) بيانات مركز الاتصالمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابأوريا جالأورياالأوريا (في خط الأنابيب) أو_INمحادثة عامة100أوريا (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابأوريا_ماالأورياالأوريا (في خط الأنابيب) أو_INالوسائط السمعية40أوريا (في خط الأنابيب) بيانات صوت الوسائطملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالبولندية MA_16البولنديّةالبولنديّةpl_PL16 كيلو هرتزالوسائط السمعية269وسائل الإعلام البولنديةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 173 ذكر 354 مجهول 6
خطابالبولندية Poland_SM_48البولندية (بولندا)البولندية (بولندا)EN-GB48 كيلو هرتزمناجاة مكتوبة1,482بولندا البولندية - مناجاة مكتوبةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1324 ذكر 701 غير معروف 24
خطابالبنجابية_CC_8البنجابيةالبنجابية (في خط الأنابيب) البنجابيةمركز الاتصال60بيانات مركز الاتصال البنجابية (في خط الأنابيب)محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالبنجابية_GCالبنجابيةالبنجابية (في خط الأنابيب) البنجابيةمحادثة عامة100البنجابية (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالبنجابية_ماالبنجابيةالبنجابية (في خط الأنابيب) البنجابية الوسائط السمعية40البنجابية (في خط الأنابيب) البيانات الصوتية للوسائطملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالروسية_SM_48روسيروسيRU-RU48 كيلو هرتزمناجاة مكتوبة2,398مناجاة مكتوبة بالروسيةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1689 ذكر 1937 غير معروف 214
خطابسكوتيش_ك_8الاسكتلندية (لهجة إنجليزية)الاسكتلندية (لهجة إنجليزية)ar_AB8 كيلو هرتزمحادثة عامة292بيانات المحادثة العامة الاسكتلنديةمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 285 ، ذكر 260 ، غير معروف 3
خطابسنغافورة_CC_8سنغافورة الإنجليزيةسنغافورة الإنجليزيةar_SG8 كيلو هرتزمركز الاتصال218بيانات مركز الاتصال في سنغافورةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة2139 ذكر 884 غير معروف 21
خطابسنغافورة_ MA_16سنغافورة الإنجليزيةسنغافورة الإنجليزيةar_SG16 كيلو هرتزالوسائط السمعية247بيانات صوت وسائط سنغافورةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 160 ذكر 455 غير معروف 37
خطابجنوب إفريقيا English_CC_8الإنجليزية جنوب أفريقياالإنجليزية جنوب أفريقياar_ZA8 كيلو هرتزمركز الاتصال261بيانات مركز الاتصال باللغة الإنجليزية في جنوب إفريقيامحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1274 ، ذكر 935 ، غير معروف 1
خطابجنوب إفريقيا English_MA_16الإنجليزية جنوب أفريقياالإنجليزية جنوب أفريقياar_ZA16 كيلو هرتزالوسائط السمعية251بيانات صوت جنوب إفريقيا الإنجليزية لوسائل الإعلامملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 235 ذكر 432 غير معروف 36
خطابالسواحيلية_CC_8السواحليةالسواحليةsw_KE8 كيلو هرتزمركز الاتصال230بيانات مركز الاتصال السواحيليةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 611 ذكر 833 غير معروف 0
خطابالسواحيلية_MA_16السواحليةالسواحليةsw_KE16 كيلو هرتزالوسائط السمعية265البيانات الصوتية للوسائط السواحيليةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 118 ذكر 493 غير معروف 25
خطابسويدي_CC_8السويديةالسويديةsv_SE8 كيلو هرتزمركز الاتصال250بيانات مركز الاتصال السويديمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1581 ، ذكر 727 ، غير معروف 2
خطابالسويدية MA_16السويديةالسويديةsv_SE16 كيلو هرتزالوسائط السمعية278بيانات صوت الوسائط السويديةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 195 ، ذكر 500 ، غير معروف 21
خطابالتاميل_CC_8التاميلالتاميلية (في خط الأنابيب) تا_ينمركز الاتصال60التاميل (في خط الأنابيب) بيانات مركز الاتصالمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابTamil_GCالتاميلالتاميلية (في خط الأنابيب) تا_ينمحادثة عامة100التاميل (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابTamil_MAالتاميل التاميلية (في خط الأنابيب) تا_ينالوسائط السمعية40التاميل (في خط الأنابيب) بيانات صوت الوسائطملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالتيلجو_GC_8التيلجوالتيلجوte_IN8 كيلو هرتزمحادثة عامة553بيانات المحادثة العامة التيلجومحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة574 ذكر 564 غير معروف 0
خطابالتيلجو_MA_16التيلجوالتيلجوte_IN16 كيلو هرتزالوسائط السمعية648بيانات الصوت Telugu Mediaملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 207 ذكر 963 غير معروف 2
خطابالتيلجو_CC_8التيلجوالتيلجو (في خط الأنابيب) te_INمركز الاتصال30بيانات مركز الاتصال التيلجو (في خط الأنابيب)محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابTelugu_GCالتيلجوالتيلجو (في خط الأنابيب) te_INمحادثة عامة50التيلجو (في خط الأنابيب) بيانات المحادثة العامةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،الحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالتيلجو_ماالتيلجوالتيلجو (في خط الأنابيب) te_INالوسائط السمعية20التيلجو (في خط الأنابيب) بيانات صوت الوسائطملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
خطابالتايلاندية_GC_8تايلانديتايلانديth_TH8 كيلو هرتزمحادثة عامة183المحادثة التايلاندية العامةمحادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، سجل غير رسمي يستخدم بين الأصدقاءمزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 338 ذكر 96 غير معروف 8
خطابالتايلاندية_MA_8تايلانديتايلانديth_TH16 كيلو هرتزالوسائط السمعية173صوت الوسائط التايلانديةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 143 ذكر 502 غير معروف 26
خطابالتركية Turkey_SM_48تركيا التركيةتركيا التركيةTR-TR48 كيلو هرتزمناجاة مكتوبة2,027تركيا التركيةالتسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانيةبالأبيض والأسودتطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 1561 ذكر 1241 غير معروف 31
خطابالفيتنامية_GC_8الفيتناميةالفيتناميةvi_VN8 كيلو هرتزمحادثة عامة295بيانات المحادثة العامة الفيتناميةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (النطاق): 5-15 دقيقة ، الشمالية (على سبيل المثال ، هانوي) ، الوسطى ، والجنوبية (على سبيل المثال ، مدينة هو تشي مينه).مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةإناث 400 ، ذكور 380 ، مجهولون 2
خطابالفيتنامية_MA_16الفيتناميةالفيتناميةvi_VN16 كيلو هرتزالوسائط السمعية257بيانات صوت الوسائط الفيتناميةملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقةبالأبيض والأسودمصادر الويب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةإناث 249 ، ذكور 200 ، مجهولون 45
خطابالويلزيةالويلزية (اللهجة الإنجليزية)الويلزية (اللهجة الإنجليزية)ar_WL8 كيلو هرتزمحادثة عامة278بيانات المحادثة العامة الويلزيةمحادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة،مزدوجالحاسوب5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةأنثى 270 ذكر 324 غير معروف 0
خطابالإنجليزية في المملكة المتحدة_WW_16المملكة المتحدة الإنجليزيةالمملكة المتحدة الإنجليزيةar_uk16 كيلو هرتزاستيقظ كلمة200 المتحدثوناستيقظ كلمة المملكة المتحدة الإنجليزيةمجموعة عبارات مفتاحية من البيانات
  • مكبرات الصوت 200
  • 4 جمل رئيسية فريدة لكل متحدث
  • 25-30 تسجيلًا متكررًا للعبارات الرئيسية لكل عبارة رئيسية فريدة
  • 25-30 ملفًا صوتيًا لكل عبارة رئيسية فريدة
  • 120 مجموع الكلام المسجل لكل متحدث
قناة 1تطبيق الموبايل5.0. الرعايا.jsonASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغةالجنس: 50٪ ذكور ، 50٪ إناث ، +/- 10٪.

الخدمات المقدمة

إن جمع بيانات الصوت من الخبراء ليس كل شيء على سطح السفينة لإعدادات شاملة للذكاء الاصطناعي. في Shaip ، يمكنك حتى التفكير في الخدمات التالية لجعل النماذج أكثر انتشارًا من المعتاد:

جمع البيانات النصية

جمع البيانات النصية
خدمات

تكمن القيمة الحقيقية لخدمات جمع البيانات المعرفية في Shaip في أنها تمنح المؤسسات المفتاح لفتح المعلومات الهامة الموجودة في البيانات غير المهيكلة

جمع بيانات الصورة

خدمات جمع بيانات الصور

تأكد من أن نموذج رؤية الكمبيوتر الخاص بك يحدد كل صورة بدقة ، لتدريب الجيل التالي من نماذج الذكاء الاصطناعي في المستقبل بسلاسة

جمع بيانات الفيديو

خدمات جمع بيانات الفيديو

ركز الآن على رؤية الكمبيوتر جنبًا إلى جنب مع البرمجة اللغوية العصبية لتدريب النماذج الخاصة بك على تحديد الأشياء والأفراد والردع والعناصر المرئية الأخرى لتحقيق الكمال

شايب اتصل بنا

تريد بناء مجموعة البيانات الصوتية الخاصة بك؟

تواصل مع خبير جمع بيانات الكلام الداخلي لدينا لإعداد مستودع صوت يناسب متطلباتك على أفضل وجه

  • بالتسجيل ، أنا أتفق مع Shaip سياسة الخصوصية و شروط الخدمة وأقدم موافقتي على تلقي اتصالات تسويقية B2B من Shaip.

يشير جمع بيانات الكلام لنموذج ML إلى عملية جمع التسجيلات الصوتية للغة المنطوقة. تساعد هذه المجموعة في تدريب وتحسين خوارزميات التعلم الآلي، خاصة تلك التي تركز على فهم ومعالجة الأصوات البشرية.

عندما تهدف إلى جمع البيانات الصوتية للتعرف التلقائي على الكلام (ASR)، يجب أن تبدأ بتحديد الاحتياجات المحددة لمشروعك، بما في ذلك اللغة المطلوبة واللهجة ونوع الكلام. بعد تعيين هذه المعلمات، تأكد من حصولك على جميع الأذونات اللازمة لاحترام خصوصية المستخدم. ثم استخدم أجهزة أو برامج التسجيل المناسبة لالتقاط عينات صوتية واضحة. يجب أن يتم شرح كل تسجيل بدقة مع النسخ أو البيانات الوصفية الأخرى ذات الصلة وتخزينها بشكل منهجي للوصول إليها بسهولة.

تعد مجموعة بيانات الكلام في التعلم الآلي أمرًا محوريًا للتدريب والاختبار والتحقق من صحة النماذج المصممة للتعرف على اللغة المنطوقة أو نسخها أو تفسيرها. تمهد مجموعات البيانات هذه الطريق لعدد لا يحصى من التطبيقات، بدءًا من المساعدين الصوتيين وخدمات النسخ إلى القياسات الحيوية الصوتية.

لجمع بيانات دقيقة من لغات ولهجات متنوعة، يعد التعاون مع المتحدثين الأصليين من الخلفيات اللغوية المرغوبة أمرًا حيويًا. تهدف إلى الحصول على عينة متنوعة وتمثيلية لتغطية مجموعة واسعة من الفروق الديموغرافية. استخدم معدات تسجيل موحدة في بيئات موحدة لضمان اتساق الصوت. والأهم من ذلك، قم بإضافة تعليقات توضيحية لكل جزء من البيانات مع النسخ التفصيلية والبيانات الوصفية، للإشارة إلى اللغة واللهجة المحددة.