مجموعة البيانات التايلاندية
ชุด ข้อมูล ภาษา ไทย
نبذة
اسم الخدمة
التايلاندية مجموعة بيانات اللغة
نوع مجموعة البيانات
محادثة عامة
القناة اليسرى
القناة الصحيحة
وصف المنتج
محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، سجل غير رسمي يستخدم بين الأصدقاء.
استخدام القضية
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
183
معدل العينة
8 كيلو هرتز
قناة الصوت
مزدوج
منصة التسجيل
سطح المكتب
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
التايلاندية
اللغة
التايلاندية
النوع
أنثى 338 ذكر 96 غير معروف 8
عدد مكبرات الصوت
442
العمر
18-50
نبذة
وصف المنتج
ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة.
استخدام القضية
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
173
معدل العينة
16 كيلو هرتز
قناة الصوت
بالأبيض والأسود
منصة التسجيل
مصادر الويب
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
التايلاندية
اللغة
التايلاندية
النوع
أنثى 143 ذكر 502 غير معروف 26
عدد مكبرات الصوت
671
العمر
18-50
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام