مجموعات بيانات صوتية / كلام / صوت عالية الجودة لتدريب نموذج الذكاء الاصطناعي الخاص بالمحادثة
مجموعات بيانات الصوت / الكلام / الصوت الجاهزة بلغات متعددة لبدء تشغيل نماذج التعرف التلقائي على الكلام (ASR)
قم بتوصيل كتالوج البيانات الصوتية الذي كنت تفتقده اليوم
تفاصيل المنتج | معرف المجموعة (فريد) | البحث عن كلمة | مجموعة بيانات اللغة | رمز اللغة | معدل العينة | نوع مجموعة البيانات | إجمالي ساعات الصوت | وصف قصير | وصف مجموعة البيانات | قناة الصوت | منصة التسجيل | WER (٪) | تنسيق الصوت | تنسيق النسخ | استخدام القضية | عدد مكبرات الصوت | CTA |
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
ar_US_CC_8 | الأمريكية الأفريقية العامية | الأمريكية الأفريقية العامية | en_US | 8 كيلو هرتز | مركز الاتصال | 211 | بيانات مركز الاتصال العامية الأمريكية الأفريقية | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 612 ، ذكر: 1242 ، غير معروف: 12 | تواصل معا | |
ar_US_MA_16 | الأمريكية الأفريقية العامية | الأمريكية الأفريقية العامية | en_US | 16 كيلو هرتز | الوسائط السمعية | 154 | بيانات وسائل الإعلام الأمريكية الأفريقية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 151 ، ذكر: 150 ، غير معروف: 10 | تواصل معا | |
Afrikaans_GC_8 | الأفريكانية | الأفريكانية | af_ZA | 8 كيلو هرتز | محادثة عامة | 368 | بيانات المحادثة العامة باللغة الأفريكانية | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، يتم التحدث باللغة الأفريكانية في إفريقيا | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 502 ، ذكر: 390 ، غير معروف: 2 | تواصل معا | |
اللغة الأفريكانية_MA_16 | الأفريكانية | الأفريكانية | af_ZA | 16 كيلو هرتز | الوسائط السمعية | 658 | ملفات الوسائط باللغة الأفريكانية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 750 ، ذكر: 1278 ، غير معروف: 52 | تواصل معا | |
Arabic_GC_8 | العربيه | العربيه | ar_AE | 8 كيلو هرتز | محادثة عامة | 292 | بيانات المحادثة العامة باللغة العربية | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، العربية من دول الخليج | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 171 ، ذكر: 534 ، غير معروف: 1 | تواصل معا | |
عربي_SM_48 | العربيه | العربيه | AR-SA | 48 كيلو هرتز | مناجاة مكتوبة | 1,947 | مناجاة مكتوبة باللغة العربية | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 838 ذكر 1209 غير معروف 78 | تواصل معا | |
Assamese_CC_8 | الأسامية | الأسامية (في خط الأنابيب) | as_IN | مركز الاتصال | 60 | بيانات مركز الاتصال الأسامية (في خط الأنابيب) | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Assamese_GC | الأسامية | الأسامية (في خط الأنابيب) | as_IN | محادثة عامة | 100 | أساميز (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Assamese_MA | الأسامية | الأسامية (في خط الأنابيب) | as_IN | الوسائط السمعية | 40 | البيانات الصوتية للوسائط الأسامية (في خط الأنابيب) | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
البنغالية _CC_8 | البنغالية | البنغالية (في خط الأنابيب) | bn_IN | مركز الاتصال | 60 | بيانات مركز الاتصال البنغالية (في خط الأنابيب) | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
البنغالية | البنغالية | البنغالية (في خط الأنابيب) | bn_IN | محادثة عامة | 100 | البنغالية (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
البنغالية | البنغالية | البنغالية (في خط الأنابيب) | bn_IN | الوسائط السمعية | 40 | البيانات الصوتية للوسائط البنغالية (في خط الأنابيب) | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
بوسطن_CC_8 | بوسطن الإنجليزية | بوسطن الإنجليزية | en_US | 8 كيلو هرتز | مركز الاتصال | 177 | بيانات مركز اتصال بوسطن | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 605 ، ذكر: 711 ، غير معروف: 0 | تواصل معا | |
Boston_GC_8 | بوسطن الإنجليزية | بوسطن الإنجليزية | en_US | 8 كيلو هرتز | محادثة عامة | 32 | بيانات المحادثة العامة في بوسطن | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 53 ، ذكر: 83 ، غير معروف: 0 | تواصل معا | |
بوسطن_MA_16 | بوسطن الإنجليزية | بوسطن الإنجليزية | en_US | 16 كيلو هرتز | الوسائط السمعية | 93 | بيانات الصوت بوسطن ميديا | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 43 ، ذكر: 181 ، غير معروف: 2 | تواصل معا | |
الكندية_SM_48 | الكندية الفرنسية | الكندية الفرنسية | الاب-CA | 48 كيلو هرتز | مناجاة مكتوبة | 1,222 | الكندية الفرنسية | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 974 ذكر 631 غير معروف 1 | تواصل معا | |
Chinese_CC_8 | الصينية الإنجليزية | الصينية الإنجليزية | en_US | 8 كيلو هرتز | مركز الاتصال | 169 | بيانات مركز الاتصال الصيني | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 1790 ، ذكر: 523 ومجهول: 13 | تواصل معا | |
الصينية_MA_16 | الصينية الإنجليزية | الصينية الإنجليزية | en_US | 16 كيلو هرتز | الوسائط السمعية | 249 | بيانات صوت الوسائط الصينية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 126 ، ذكر: 346 ومجهول: 6 | تواصل معا | |
الصينية المبسطة SM_48 | الصينية المبسطة | الصينية المبسطة | زكية-CN | 48 كيلو هرتز | مناجاة مكتوبة | 2,762 | الصينية المبسطة | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1920 ذكر 1535 غير معروف 270 | تواصل معا | |
الصينية Traditional_SM_48 | الصينية التقليدية | الصينية التقليدية | zh-TW | 48 كيلو هرتز | مناجاة مكتوبة | 1,028 | الصينية التقليدية | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1069 ذكر 262 غير معروف 3 | تواصل معا | |
Danish_GC_8 | الدانماركية | الدانماركية | da_DK | 8 كيلو هرتز | محادثة عامة | 372 | بيانات المحادثة العامة الدنماركية | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 311، ذكر: 417، غير معروف: 0 | تواصل معا | |
الدنماركية_MA_16 | الدانماركية | الدانماركية | da_DK | 16 كيلو هرتز | الوسائط السمعية | 664 | بيانات صوت الوسائط الدنماركية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى: 369، ذكر: 864، غير معروف: 27 | تواصل معا | |
الدنماركية_SM_48 | الدانماركية | الدانماركية | دا-DK | 48 كيلو هرتز | مناجاة مكتوبة | 2,579 | مناجاة الدنماركية المكتوبة | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية ، الدنماركية من الدنمارك | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1551 ذكر 1233 غير معروف 42 | تواصل معا | |
الإنجليزية العميقة الجنوبية_CC_8 | إنجليش ديب ساوث | إنجليش ديب ساوث | en_US | 8 كيلو هرتز | مركز الاتصال | 151 | بيانات مركز الاتصال في الجنوب العميق | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 221 ، ذكر 1004 ، غير معروف 7 | تواصل معا | |
الإنجليزية ديب South_GC_8 | إنجليش ديب ساوث | إنجليش ديب ساوث | en_US | 8 كيلو هرتز | محادثة عامة | 56 | بيانات المحادثة العامة باللغة الإنجليزية في الجنوب العميق | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | 99 أنثى 31 ذكر غير معروف 0 | تواصل معا | |
إنجليش ديب South_MA_16 | إنجليش ديب ساوث | إنجليش ديب ساوث | en_US | 16 كيلو هرتز | الوسائط السمعية | 266 | بيانات الصوت الإنجليزية Deep South Media | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | 204 أنثى 356 ذكر غير معروف 21 | تواصل معا | |
الألمانية_CC_8 | الألمانيّة | الألمانيّة | دي دي | 8 كيلو هرتز | مركز الاتصال | 64 | بيانات مركز الاتصال الألماني | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | بالأبيض والأسود | سطح المكتب | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 478 ذكر 1440 غير معروف 0 | تواصل معا | ||
الألمانية_IVR_8 | الألمانيّة | الألمانيّة | دي دي | 8 كيلو هرتز | IVR | 200 | بيانات IVR الألمانية | إنسان لآلة. نوع تدفق IVR حيث يوجد موجه TTS (على سبيل المثال "كيف يمكنني مساعدتك") متبوعًا باستجابة بشرية عفوية | بالأبيض والأسود | سطح المكتب | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 10115 ذكر 8750 غير معروف 0 | تواصل معا | ||
Gujarati_CC_8 | الغوجاراتية | الغوجاراتية (في خط الأنابيب) | gu_IN | مركز الاتصال | 60 | بيانات مركز الاتصال الغوجاراتية (في خط الأنابيب) | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Gujarati_GC | الغوجاراتية | الغوجاراتية (في خط الأنابيب) | gu_IN | محادثة عامة | 100 | الغوجاراتية (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Gujarati_MA | الغوجاراتية | الغوجاراتية (في خط الأنابيب) | gu_IN | الوسائط السمعية | 40 | بيانات صوت الوسائط الغوجاراتية (في خط الأنابيب) | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
العبرية_المحادثة العامة_8 | العبرية | العبرية | هو_IL | 8 كيلو هرتز | محادثة عامة | 399 | بيانات المحادثة العامة العبرية | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، العبرية في إسرائيل | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 414 ، ذكر 399 ، غير معروف 1 | تواصل معا | |
العبرية_MA_16 | العبرية | العبرية | هو_IL | 16 كيلو هرتز | الوسائط السمعية | 427 | البيانات الصوتية لوسائل الإعلام العبرية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 361 ، ذكر 513 ، غير معروف 13 | تواصل معا | |
الهندية_MA_16 | الهندية | الهندية | مرحبا في | 16 كيلو هرتز | الوسائط السمعية | 219 | بيانات الصوت الهندية للوسائط | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 83 ، ذكر 309 ، غير معروف 0 | تواصل معا | |
الهندية_SM_48 | الهندية | الهندية | مرحبا في | 48 كيلو هرتز | مناجاة مكتوبة | 2,867 | مناجاة هندية مكتوبة | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1977 ذكر 1864 غير معروف 147 | تواصل معا | |
HINGLISH_CC_8 | هنجليزية | هنجليزية | hg_IN | 8 كيلو هرتز | مركز الاتصال | 208 | بيانات مركز الاتصال المعلقة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 822 ذكر 1262 غير معروف 0 | تواصل معا | |
HINGLISH_MA_16 | هنجليزية | هنجليزية | hg_IN | 16 كيلو هرتز | الوسائط السمعية | 216 | HINGLISH بيانات صوت الوسائط | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | 75 ذكر 380 غير معروف 0 | تواصل معا | |
Hispanic_CC_8 | الإنجليزية الإسبانية | الإنجليزية الإسبانية | en_US | 8 كيلو هرتز | مركز الاتصال | 212 | بيانات مركز الاتصال من أصل اسباني | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 822 ذكر 1262 غير معروف 0 | تواصل معا | |
اسباني_MA_16 | الإنجليزية الإسبانية | الإنجليزية الإسبانية | en_US | 16 كيلو هرتز | الوسائط السمعية | 155 | صوت من أصل اسباني نداء ميديا | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 140 ذكر 219 غير معروف 5 | تواصل معا | |
الأندونيسية_GC_8 | الأندونيسية | الأندونيسية | فعلت | 8 كيلو هرتز | محادثة عامة | 496 | بيانات المحادثة العامة الإندونيسية | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، البهاسا الإندونيسية | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 524 ذكر 454 غير معروف 2 | تواصل معا | |
الأندونيسية_MA_16 | الأندونيسية | الأندونيسية | فعلت | 16 كيلو هرتز | الوسائط السمعية | 643 | بيانات صوت الوسائط الإندونيسية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 746 ذكر 1507 غير معروف 129 | تواصل معا | |
الأيرلندية_GC_8 | الأيرلندية | الأيرلندية | ar_IE | 8 كيلو هرتز | محادثة عامة | 192 | بيانات المحادثة العامة الأيرلندية | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 213 ، ذكر 153 ، غير معروف 0 | تواصل معا | |
اليابانية_SM_48 | اليابانيّة | اليابانيّة | جا-JP | 48 كيلو هرتز | مناجاة مكتوبة | 2,335 | مناجاة يابانية مكتوبة | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1460 ذكر 1221 غير معروف 194 | تواصل معا | |
الكانادا_CC_8 | الكانادا | الكانادا (في خط الأنابيب) | kn_IN | مركز الاتصال | 60 | الكانادا (في خط الأنابيب) بيانات مركز الاتصال | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Kannada_GC | الكانادا | الكانادا (في خط الأنابيب) | kn_IN | محادثة عامة | 100 | الكانادا (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Kannada_MA | الكانادا | الكانادا (في خط الأنابيب) | kn_IN | الوسائط السمعية | 40 | الكانادا (في خط الأنابيب) بيانات صوت الوسائط | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
الكورية_CC_8 | الكوريّة | الكوريّة | ko_KR | 8 كيلو هرتز | مركز الاتصال | 107 | بيانات مركز الاتصال الكوري | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1086 ذكر 210 غير معروف 4 | تواصل معا | |
كوري_ما_16 | الكوريّة | الكوريّة | ko_KR | 16 كيلو هرتز | الوسائط السمعية | 204 | بيانات صوت الوسائط الكورية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 70 ذكر 303 غير معروف 25 | تواصل معا | |
كوري_SM_48 | الكوريّة | الكوريّة | كو-KR | 48 كيلو هرتز | مناجاة مكتوبة | 1,955 | مناجاة نصية كورية | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1195 ذكر 1134 غير معروف 122 | تواصل معا | |
Malay_GC_8 | الملايوية | الملايوية | ms_MY | 8 كيلو هرتز | محادثة عامة | 266 | بيانات المحادثة العامة الملايو | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، الملايو في ماليزيا | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 316 ، ذكر 176 ، غير معروف 0 | تواصل معا | |
الملايو MA_16 | الملايوية | الملايوية | ms_MY | 16 كيلو هرتز | الوسائط السمعية | 344 | بيانات الصوت الملايو ميديا | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | 236 أنثى 626 ذكر غير معروف 47 | تواصل معا | |
Malayalam_CC_8 | المالايالامية | المالايالامية (في خط الأنابيب) | ml_IN | مركز الاتصال | 60 | المالايالامية (في خط الأنابيب) بيانات مركز الاتصال | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
مالايالام ج | المالايالامية | المالايالامية (في خط الأنابيب) | ml_IN | محادثة عامة | 100 | المالايالامية (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
المالايالامية | المالايالامية | المالايالامية (في خط الأنابيب) | ml_IN | الوسائط السمعية | 40 | المالايالامية (في خط الأنابيب) بيانات صوت الوسائط | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
المهاراتية | المراتية | المهاراتية (في خط الأنابيب) | السيد_IN | مركز الاتصال | 60 | الماراثية (في خط الأنابيب) بيانات مركز الاتصال | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Marathi_GC | المراتية | المهاراتية (في خط الأنابيب) | السيد_IN | محادثة عامة | 100 | المهاراتية (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
المهاراتية | المراتية | المهاراتية (في خط الأنابيب) | السيد_IN | الوسائط السمعية | 40 | البيانات الصوتية للوسائط الماراثية (في خط الأنابيب) | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
المكسيكي_SM_48 | الإسبانية (المكسيك) | الإسبانية (المكسيك) | ES-MX | 48 كيلو هرتز | مناجاة مكتوبة | 1,492 | مونولوج مكسيكي إسباني مكتوب | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1016 ذكر 1069 غير معروف 95 | تواصل معا | |
هولندا_SM_48 | الهولندية | الهولندية | EN-GB | 48 كيلو هرتز | مناجاة مكتوبة | 1,205 | مناجاة نصية هولندية | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1285 ذكر 531 غير معروف 3 | تواصل معا | |
نيويورك English_CC_8 | نيويورك الإنجليزية | نيويورك الإنجليزية | en_US | 8 كيلو هرتز | مركز الاتصال | 103 | بيانات مركز الاتصال باللغة الإنجليزية في نيويورك | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 610 ، ذكر 532 ، غير معروف 0 | تواصل معا | |
نيويورك English_GC_8 | نيويورك الإنجليزية | نيويورك الإنجليزية | en_US | 8 كيلو هرتز | محادثة عامة | 107 | بيانات المحادثة العامة باللغة الإنجليزية في نيويورك | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 118 ذكر 114 غير معروف 0 | تواصل معا | |
نيويورك English_MA_16 | نيويورك الإنجليزية | نيويورك الإنجليزية | en_US | 16 كيلو هرتز | الوسائط السمعية | 140 | بيانات صوت New York English Media | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 66 ذكر 230 غير معروف 11 | تواصل معا | |
New Zealand_GC_8 | نيوزيلندا الإنجليزية | نيوزيلندا الإنجليزية | en_NZ | 8 كيلو هرتز | محادثة عامة | 148 | نيوزيلندا الإنجليزية بيانات المحادثة العامة | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 167 ذكر 121 غير معروف 4 | تواصل معا | |
نيوزيلندا_MA_16 | نيوزيلندا الإنجليزية | نيوزيلندا الإنجليزية | en_NZ | 16 كيلو هرتز | الوسائط السمعية | 400 | نيوزيلندا وسائل الإعلام الإنجليزية السمعية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 367 ذكر 678 غير معروف 26 | تواصل معا | |
أوريا_CC_8 | الأوريا | الأوريا (في خط الأنابيب) | أو_IN | مركز الاتصال | 60 | أوريا (في خط الأنابيب) بيانات مركز الاتصال | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
أوريا ج | الأوريا | الأوريا (في خط الأنابيب) | أو_IN | محادثة عامة | 100 | أوريا (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
أوريا_ما | الأوريا | الأوريا (في خط الأنابيب) | أو_IN | الوسائط السمعية | 40 | أوريا (في خط الأنابيب) بيانات صوت الوسائط | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
البولندية MA_16 | البولنديّة | البولنديّة | pl_PL | 16 كيلو هرتز | الوسائط السمعية | 269 | وسائل الإعلام البولندية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 173 ذكر 354 مجهول 6 | تواصل معا | |
البولندية Poland_SM_48 | البولندية (بولندا) | البولندية (بولندا) | EN-GB | 48 كيلو هرتز | مناجاة مكتوبة | 1,482 | بولندا البولندية - مناجاة مكتوبة | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1324 ذكر 701 غير معروف 24 | تواصل معا | |
البنجابية_CC_8 | البنجابية | البنجابية (في خط الأنابيب) | البنجابية | مركز الاتصال | 60 | بيانات مركز الاتصال البنجابية (في خط الأنابيب) | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Punjabi_GC | البنجابية | البنجابية (في خط الأنابيب) | البنجابية | محادثة عامة | 100 | البنجابية (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
البنجابية_ما | البنجابية | البنجابية (في خط الأنابيب) | البنجابية | الوسائط السمعية | 40 | البنجابية (في خط الأنابيب) البيانات الصوتية للوسائط | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
الروسية_SM_48 | الروسية | الروسية | RU-RU | 48 كيلو هرتز | مناجاة مكتوبة | 2,398 | مناجاة مكتوبة بالروسية | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1689 ذكر 1937 غير معروف 214 | تواصل معا | |
سكوتيش_ك_8 | الاسكتلندية (لهجة إنجليزية) | الاسكتلندية (لهجة إنجليزية) | ar_AB | 8 كيلو هرتز | محادثة عامة | 292 | بيانات المحادثة العامة الاسكتلندية | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 285 ، ذكر 260 ، غير معروف 3 | تواصل معا | |
سنغافورة_CC_8 | سنغافورة الإنجليزية | سنغافورة الإنجليزية | ar_SG | 8 كيلو هرتز | مركز الاتصال | 218 | بيانات مركز الاتصال في سنغافورة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | 2139 ذكر 884 غير معروف 21 | تواصل معا | |
سنغافورة_ MA_16 | سنغافورة الإنجليزية | سنغافورة الإنجليزية | ar_SG | 16 كيلو هرتز | الوسائط السمعية | 247 | بيانات صوت وسائط سنغافورة | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 160 ذكر 455 غير معروف 37 | تواصل معا | |
جنوب إفريقيا English_CC_8 | الإنجليزية جنوب أفريقيا | الإنجليزية جنوب أفريقيا | ar_ZA | 8 كيلو هرتز | مركز الاتصال | 261 | بيانات مركز الاتصال باللغة الإنجليزية في جنوب إفريقيا | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1274 ، ذكر 935 ، غير معروف 1 | تواصل معا | |
جنوب إفريقيا English_MA_16 | الإنجليزية جنوب أفريقيا | الإنجليزية جنوب أفريقيا | ar_ZA | 16 كيلو هرتز | الوسائط السمعية | 251 | بيانات صوت جنوب إفريقيا الإنجليزية لوسائل الإعلام | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 235 ذكر 432 غير معروف 36 | تواصل معا | |
السواحيلية_CC_8 | السواحلية | السواحلية | sw_KE | 8 كيلو هرتز | مركز الاتصال | 230 | بيانات مركز الاتصال السواحيلية | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 611 ذكر 833 غير معروف 0 | تواصل معا | |
السواحيلية_MA_16 | السواحلية | السواحلية | sw_KE | 16 كيلو هرتز | الوسائط السمعية | 265 | البيانات الصوتية للوسائط السواحيلية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 118 ذكر 493 غير معروف 25 | تواصل معا | |
Swedish_CC_8 | السويدية | السويدية | sv_SE | 8 كيلو هرتز | مركز الاتصال | 250 | بيانات مركز الاتصال السويدي | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1581 ، ذكر 727 ، غير معروف 2 | تواصل معا | |
السويدية MA_16 | السويدية | السويدية | sv_SE | 16 كيلو هرتز | الوسائط السمعية | 278 | بيانات صوت الوسائط السويدية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 195 ، ذكر 500 ، غير معروف 21 | تواصل معا | |
Tamil_CC_8 | التاميل | التاميلية (في خط الأنابيب) | تا_ين | مركز الاتصال | 60 | التاميل (في خط الأنابيب) بيانات مركز الاتصال | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Tamil_GC | التاميل | التاميلية (في خط الأنابيب) | تا_ين | محادثة عامة | 100 | التاميل (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Tamil_MA | التاميل | التاميلية (في خط الأنابيب) | تا_ين | الوسائط السمعية | 40 | التاميل (في خط الأنابيب) بيانات صوت الوسائط | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Telugu_GC_8 | التيلجو | التيلجو | te_IN | 8 كيلو هرتز | محادثة عامة | 553 | بيانات المحادثة العامة التيلجو | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | 574 ذكر 564 غير معروف 0 | تواصل معا | |
التيلجو_MA_16 | التيلجو | التيلجو | te_IN | 16 كيلو هرتز | الوسائط السمعية | 648 | بيانات الصوت Telugu Media | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 207 ذكر 963 غير معروف 2 | تواصل معا | |
التيلجو_CC_8 | التيلجو | التيلجو (في خط الأنابيب) | te_IN | مركز الاتصال | 30 | بيانات مركز الاتصال التيلجو (في خط الأنابيب) | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Telugu_GC | التيلجو | التيلجو (في خط الأنابيب) | te_IN | محادثة عامة | 50 | التيلجو (في خط الأنابيب) بيانات المحادثة العامة | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
التيلجو_ما | التيلجو | التيلجو (في خط الأنابيب) | te_IN | الوسائط السمعية | 20 | التيلجو (في خط الأنابيب) بيانات صوت الوسائط | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | تواصل معا | ||||
Thai_GC_8 | التايلاندية | التايلاندية | th_TH | 8 كيلو هرتز | محادثة عامة | 183 | المحادثة التايلاندية العامة | محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، سجل غير رسمي يستخدم بين الأصدقاء | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 338 ذكر 96 غير معروف 8 | تواصل معا | |
التايلاندية_MA_8 | التايلاندية | التايلاندية | th_TH | 16 كيلو هرتز | الوسائط السمعية | 173 | صوت الوسائط التايلاندية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 143 ذكر 502 غير معروف 26 | تواصل معا | |
التركية Turkey_SM_48 | تركيا التركية | تركيا التركية | TR-TR | 48 كيلو هرتز | مناجاة مكتوبة | 2,027 | تركيا التركية | التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية | بالأبيض والأسود | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 1561 ذكر 1241 غير معروف 31 | تواصل معا | |
الفيتنامية_GC_8 | الفيتنامية | الفيتنامية | vi_VN | 8 كيلو هرتز | محادثة عامة | 295 | بيانات المحادثة العامة الفيتنامية | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (النطاق): 5-15 دقيقة ، الشمالية (على سبيل المثال ، هانوي) ، الوسطى ، والجنوبية (على سبيل المثال ، مدينة هو تشي مينه). | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | إناث 400 ، ذكور 380 ، مجهولون 2 | تواصل معا | |
الفيتنامية_MA_16 | الفيتنامية | الفيتنامية | vi_VN | 16 كيلو هرتز | الوسائط السمعية | 257 | بيانات صوت الوسائط الفيتنامية | ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة | بالأبيض والأسود | مصادر الويب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | إناث 249 ، ذكور 200 ، مجهولون 45 | تواصل معا | |
الويلزية | الويلزية (اللهجة الإنجليزية) | الويلزية (اللهجة الإنجليزية) | ar_WL | 8 كيلو هرتز | محادثة عامة | 278 | بيانات المحادثة العامة الويلزية | محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة، | مزدوج | سطح المكتب | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | أنثى 270 ذكر 324 غير معروف 0 | تواصل معا | |
الإنجليزية في المملكة المتحدة_WW_16 | المملكة المتحدة الإنجليزية | المملكة المتحدة الإنجليزية | ar_uk | 16 كيلو هرتز | استيقظ كلمة | 200 المتحدثون | Wake Word UK English | مجموعة عبارات مفتاحية من البيانات
| قناة 1 | موبايل التطبيق | 5.0 | . الرعايا | .json | ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة | الجنس: 50٪ ذكور ، 50٪ إناث ، +/- 10٪. | تواصل معا |
بيانات الصوت والكلام Ground Truth لتسريع تطوير الذكاء الاصطناعي للمحادثة
مع أكثر من 40 ألف ساعة من مجموعة البيانات الصوتية / مجموعة البيانات الصوتية ، يمكن أن يساعدك Shaip في توسيع نطاق نماذج الذكاء الاصطناعي للمحادثة باستخدام مجموعات بيانات الكلام عالية الجودة. يتم جمع مجموعات البيانات الصوتية ذات المعيار الذهبي بلغات ولهجات متعددة ، وديموغرافيات ، وخصائص المتحدثين ، وأنواع الحوار ، والبيئات ، والسيناريوهات. إذا لم تجد ما تبحث عنه؟ - يمكن أن يساعدك Shaip في أي مجموعة بيانات صوتية في أي جنس أو عمر أو لغة أو إعدادات.
قليل من مجموعات البيانات اللغوية التي ندعمها: لدينا مجموعات بيانات عن جميع اللغات واللهجات الرئيسية. تشمل بعض لغاتنا الأكثر شيوعًا ما يلي:
مجموعات البيانات الصوتية الأفريقية
مجموعات البيانات الصوتية العربية
مجموعات البيانات الصوتية الكندية
مجموعات البيانات الصوتية الصينية
مجموعات البيانات الصوتية الدنماركية
مجموعات البيانات الصوتية الإنجليزية
مجموعات البيانات الصوتية الألمانية
مجموعات البيانات الصوتية العبرية
مجموعات البيانات الصوتية الإندونيسية
مجموعات البيانات الصوتية الأيرلندية
مجموعات البيانات الصوتية اليابانية
مجموعات البيانات الصوتية الكورية
مجموعات البيانات الصوتية المكسيكية
مجموعات البيانات الصوتية البولندية
مجموعات البيانات الصوتية الروسية
مجموعات البيانات الصوتية الاسكتلندية
مجموعات البيانات الصوتية الإسبانية
مجموعات البيانات الصوتية السويدية
مجموعات البيانات الصوتية التايلاندية
مجموعات البيانات الصوتية التركية
مجموعات البيانات الصوتية الفيتنامية
وصف مجموعة البيانات
محادثات مركز الاتصال ٨ كيلو هرتز: محادثة هاتفية تركيبية بدون نص مكتوب: "الوكيل" و "العميل"
محادثات عامة 8 كيلو هرتز: محادثة هاتفية غير مكتوبة بين شخصين
الوسائط والبودكاست 16 كيلو هرتز: المقابلات الصوتية / المرئية للمجال العام ، والبودكاست ، إلخ. 1-5 أشخاص
الكلام / المونولوج المكتوب 16 كيلو هرتز: التسجيل على أساس موجه
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات صوتية وكلام جديدة جاهزة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام