مجموعة البيانات الكورية
한국어 데이터 셋
مجموعة بيانات كورية عالية الجودة لمراكز الاتصال، والمونولوجات النصية، والوسائط (البودكاست) للذكاء الاصطناعي ونماذج الكلام
نظرة عامة
العنوان (اللغة)
مجموعة بيانات اللغة الكورية
أنواع مجموعات البيانات
مركز الاتصال، بيانات الوسائط، المونولوج النصي
الدولة
كوريا
الوصف
تتضمن مجموعة البيانات هذه محادثات هاتفية غير مكتوبة بين العميل والوكيل (من 5 إلى 15 دقيقة)، وملفات صوتية/فيديو قابلة للترخيص في المجال العام مثل المقابلات والبودكاست مع من 1 إلى 5 مشاركين (من 15 إلى 60 دقيقة)، وحوارات مكتوبة تضم متحدثًا واحدًا يقدم محتوى محددًا مسبقًا لتدريب نموذج الكلام واللغة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
| نوع مجموعة البيانات | معدل أخذ العينات | سبيكرات | قناة | مجموع الساعات | إجمالي عدد المتحدثين |
|---|---|---|---|---|---|
| مركز الاتصال | 8 كيلو هرتز | 2 المتحدثون | مزدوج | 102:27:55 | 1,244 |
| بيانات الوسائط | 16 كيلو هرتز | مكبرات صوت متعددة | بالأبيض والأسود | 203:46:54 | 397 |
| مناجاة مكتوبة | 24 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 500:00:00 | على طلب |
| مناجاة مكتوبة | 48 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 1,955:00:00 | على طلب |
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام