مجموعة البيانات الإنجليزية الصينية
中 英文 数据 集
High-Quality Chinese English Call-Center and Podcast Dataset for AI & Speech Models
نظرة عامة
العنوان
الصينية الإنجليزية مجموعة بيانات اللغة
نوع مجموعة البيانات
مركز الاتصال
الوصف
محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
169
معدل العينة
8 كيلو هرتز
قناة الصوت
مزدوج
منصة التسجيل
الحاسوب
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
الصين
اللغة
الصينية الإنجليزية
الجنس
أنثى 1790 ذكر 523 غير معروف 13
عدد مكبرات الصوت
2,326
العمر
18-50
نظرة عامة
العنوان
الصينية الإنجليزية مجموعة بيانات اللغة
نوع مجموعة البيانات
بودكاست
الوصف
ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
249
معدل العينة
16 كيلو هرتز
قناة الصوت
بالأبيض والأسود
منصة التسجيل
مصادر الويب
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
الصين
اللغة
الصينية الإنجليزية
الجنس
أنثى 126 ذكر 346 غير معروف 6
عدد مكبرات الصوت
478
العمر
18-50
نظرة عامة
العنوان
ووهان مجموعة بيانات اللغة
نوع مجموعة البيانات
الحوار العفوي
مجموع الساعات
500
معدل العينة
16 كيلو هرتز
الصينية مجموعة بيانات اللغة
تحويل النص إلى كلام
300
16 كيلو هرتز
هوكينيز مجموعة بيانات اللغة
الحوار العفوي
100
16 كيلو هرتز
شنغهاي مجموعة بيانات اللغة
الحوار العفوي
500
16 كيلو هرتز
سيتشوان مجموعة بيانات اللغة
الحوار العفوي
500
16 كيلو هرتز
الإنجليزية (الصينية) مجموعة بيانات اللغة
مكتوبة عفوية
2,000
16 كيلو هرتز
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.

لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام