مجموعة بيانات نيويورك الإنجليزية
مجموعة بيانات عالية الجودة لمراكز الاتصال والمحادثات العامة والبودكاست باللغة الإنجليزية في نيويورك لنماذج الذكاء الاصطناعي والكلام
نظرة عامة
العنوان (اللغة)
مجموعة بيانات اللغة الإنجليزية في نيويورك
أنواع مجموعات البيانات
مركز الاتصال، المحادثة العامة، وسائل الإعلام (بودكاست)
الدولة
الولايات المتحدة
الوصف
تقدم مجموعة البيانات هذه محتوى متنوعًا للكلام والوسائط، بما في ذلك المحادثات الاصطناعية غير المكتوبة بين العميل والوكيل (5-15 دقيقة)، والمحادثات الهاتفية بين البشر (15-60 دقيقة)، والصوت الغنائي مع النسخ، والمقابلات، والبودكاست، والمونولوجات المكتوبة، مما يدعم تدريب وتقييم تقنيات الكلام واللغة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
| نوع مجموعة البيانات | معدل أخذ العينات | سبيكرات | قناة | مجموع الساعات | إجمالي عدد المتحدثين |
|---|---|---|---|---|---|
| مركز الاتصال | 8 كيلو هرتز | 2 المتحدثون | مزدوج | 117:40:09 | 1,388 |
| محادثة عامة | 8 كيلو هرتز | 2 المتحدثون | مزدوج | 156:42:48 | 510 |
| موسيقى | 16 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 135:14:18 | 288 |
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام