مجموعة بيانات التاميل
التسوق
استغل قوة مجموعات بيانات الكلام التاميلية لتقنيات التعرف الآلي على الكلام (ASR) وتحويل النص إلى كلام (TTS) والذكاء الاصطناعي للمحادثة. تقدم Shaip مجموعات بيانات صوتية تاميلية متميزة لتدريب نماذج لغوية أكثر ذكاءً.
نظرة عامة
العنوان (اللغة)
مجموعة بيانات اللغة التاميلية
أنواع مجموعات البيانات
مركز الاتصال، المحادثة العامة، بيانات الوسائط، المونولوج المكتوب
الدولة
الهند
الوصف
تتضمن مجموعة البيانات هذه محادثات اصطناعية غير مكتوبة بين العميل والوكيل (5-15 دقيقة)، ومحادثات هاتفية طبيعية بين إنسان وآخر (15-60 دقيقة)، وبيانات الوسائط مع النسخ، مما يوفر بيانات كلامية متنوعة للتدريب وتقييم تقنيات الكلام واللغة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
| نوع مجموعة البيانات | معدل أخذ العينات | سبيكرات | قناة | مجموع الساعات | إجمالي عدد المتحدثين |
|---|---|---|---|---|---|
| مركز الاتصال | 8 كيلو هرتز | 2 المتحدثون | مزدوج | 124:23:52 | 484 |
| مركز الاتصال | 16 كيلو هرتز | 2 المتحدثون | بالأبيض والأسود | 199:44:21 | 1,986 |
| محادثة عامة | 8 كيلو هرتز | 2 المتحدثون | مزدوج | 101:42:05 | 440 |
| محادثة عامة | 48 كيلو هرتز | 2 المتحدثون | بالأبيض والأسود | 80:21:16 | 141 |
| بيانات الوسائط | 16 كيلو هرتز | مكبرات صوت متعددة | بالأبيض والأسود | 43:07:01 | 32 |
| مناجاة مكتوبة | 24 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 500:00:00 | على طلب |
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام