مجموعة البيانات التايلاندية
ชุด ข้อมูล ภาษา ไทย
مجموعة بيانات عالية الجودة للمحادثات العامة التايلاندية، والمونولوجات المكتوبة، والوسائط (البودكاست) للذكاء الاصطناعي ونماذج الكلام
نظرة عامة
العنوان (اللغة)
مجموعة بيانات اللغة التايلاندية
أنواع مجموعات البيانات
محادثة عامة، وسائل الإعلام (بودكاست)، مونولوج مكتوب
الدولة
تايلاند
الوصف
تتضمن مجموعة البيانات هذه محادثات هاتفية غير مكتوبة بين شخصين باللغة العبرية من إسرائيل (15-60 دقيقة)، وملفات صوتية أو فيديو قابلة للترخيص في المجال العام مع من 1 إلى 5 مشاركين (15-60 دقيقة)، وحوارات مكتوبة حيث يقدم متحدث واحد محتوى محدد مسبقًا للتدريب وتقييم نماذج الكلام واللغة.
الحلول المقترحة
ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة
تفاصيل مجموعة البيانات
| نوع مجموعة البيانات | معدل أخذ العينات | سبيكرات | قناة | مجموع الساعات | إجمالي عدد المتحدثين |
|---|---|---|---|---|---|
| محادثة عامة | 8 كيلو هرتز | 2 المتحدثون | مزدوج | 211:48:42 | 170 |
| بيانات الوسائط | 16 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 249:14:31 | 670 |
| مناجاة مكتوبة | 24 كيلو هرتز | رئيس واحد | بالأبيض والأسود | 500:00:00 | على طلب |
عملاء متميزون
تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.
لا تستطيع أن تجد ما تبحث عنه؟
يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات
اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام