مجموعة البيانات الصينية
简体 中文 数据 集
مجموعة بيانات صينية عالية الجودة لنماذج الذكاء الاصطناعي والكلام
نظرة عامة
العنوان (اللغة)
مجموعة بيانات اللغة الصينية
أنواع مجموعات البيانات
مركز الاتصال، الموسيقى، المونولوج المكتوب، بيانات الوسائط (بيانات البودكاست)
الدولة
الصين
الوصف
تتضمن مجموعة البيانات هذه محادثات هاتفية اصطناعية غير مكتوبة بين العميل والوكيل (5-15 دقيقة)، ومحادثات هاتفية طبيعية بين إنسان وآخر (15-60 دقيقة)، وصوت غنائي مع نصوص مكتوبة، مما يوفر بيانات كلامية متنوعة للتدريب وتقييم تقنيات الكلام واللغة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
| اللغة | نوع مجموعة البيانات | معدل أخذ العينات | سبيكرات | قناة | مجموع الساعات | إجمالي عدد المتحدثين |
|---|---|---|---|---|---|---|
| الغناء الصيني | موسيقى | 48 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 06:11:32 | 10 |
| تقاليد صينية) | مناجاة مكتوبة | 48 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 1,499:00:00 | 1,805 |
| اللغة الإنجليزية بلكنة صينية | بيانات الوسائط | 16 كيلو هرتز | مكبرات صوت متعددة | بالأبيض والأسود | 306:04:58 | 2,130 |
| الصينية المبسطة | مناجاة مكتوبة | 48 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 2,761:00:00 | 3,725 |
| اللغة الإنجليزية الصينية بلكنة أمريكية | مركز الاتصال | 8 كيلو هرتز | 2 المتحدثون | مزدوج | 152:18:33 | 2,058 |
| اللغة الإنجليزية الصينية بلكنة أمريكية | بيانات الوسائط | 16 كيلو هرتز | مكبرات صوت متعددة | بالأبيض والأسود | 245:55:15 | 468 |
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام