مجموعة البيانات الإندونيسية
بيانات كومبولان إندونيسيا
مجموعة بيانات عالية الجودة للمحادثات العامة والبودكاست باللغة الإندونيسية للذكاء الاصطناعي ونماذج الكلام
نظرة عامة
العنوان
الأندونيسية مجموعة بيانات اللغة
نوع مجموعة البيانات
محادثة عامة
الوصف
محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، البهاسا الإندونيسية.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
496
معدل العينة
8 كيلو هرتز
قناة الصوت
مزدوج
منصة التسجيل
الحاسوب
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
أندونيسيا
اللغة
الأندونيسية
الجنس
أنثى 524 ذكر 454 غير معروف 2
عدد مكبرات الصوت
980
العمر
18-50
نظرة عامة
العنوان
الأندونيسية مجموعة بيانات اللغة
نوع مجموعة البيانات
بودكاست
الوصف
ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
643
معدل العينة
16 كيلو هرتز
قناة الصوت
بالأبيض والأسود
منصة التسجيل
مصادر الويب
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
أندونيسيا
اللغة
الأندونيسية
الجنس
أنثى 746 ذكر 1507 غير معروف 129
عدد مكبرات الصوت
2,382
العمر
18-50
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.

لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام