مجموعة البيانات الكورية
한국어 데이터 셋
High-Quality Korean Call-Center, TTS and Podcast Dataset for AI & Speech Models
نظرة عامة
العنوان
اللغة الكورية
بيانات
نوع مجموعة البيانات
مركز الاتصال
الوصف
محادثة هاتفية تركيبية بدون نص مكتوب بين "الوكيل" و "العميل" ، تقريبًا. مدة الصوت (المدى) 5-15 دقيقة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
107
معدل العينة
8 كيلو هرتز
قناة الصوت
مزدوج
منصة التسجيل
الحاسوب
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
الكوريّة
اللغة
الكوريّة
الجنس
أنثى 1086 ذكر 210 غير معروف 4
عدد مكبرات الصوت
1,300
العمر
18-50
نظرة عامة
العنوان
الكوريّة مجموعة بيانات اللغة
نوع مجموعة البيانات
بودكاست
الوصف
ملفات الصوت / الفيديو ذات المجال العام المرخصة مثل المقابلات والبودكاست وما إلى ذلك - من 1 إلى 5 أشخاص. تقريبا. مدة الصوت (المدى) 15-60 دقيقة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
204
معدل العينة
16 كيلو هرتز
قناة الصوت
بالأبيض والأسود
منصة التسجيل
مصادر الويب
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
الكوريّة
اللغة
الكوريّة
الجنس
أنثى 70 ذكر 303 غير معروف 25
عدد مكبرات الصوت
398
العمر
18-50
نظرة عامة
العنوان
الكوريّة مجموعة بيانات اللغة
نوع مجموعة البيانات
تحويل النص إلى كلام
الوصف
التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
مجموع الساعات
1,955
معدل العينة
48 كيلو هرتز
قناة الصوت
بالأبيض والأسود
منصة التسجيل
تطبيق الموبايل
تنسيق الصوت
. الرعايا
تنسيق النسخ
.json
WER (٪)
5
ديموغرافيات مجموعة البيانات
الدولة
الكوريّة
اللغة
الكوريّة
الجنس
أنثى 1195 ذكر 1134 غير معروف 122
عدد مكبرات الصوت
2,351
العمر
18-50
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.

لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام