مجموعة البيانات العربية

مجموعة البيانات العربية

High-Quality Arabic General Conversation, and Podcast Dataset for AI & Speech Models

نظرة عامة

العنوان

مجموعة بيانات اللغة العربية

نوع مجموعة البيانات

محادثة عامة

الوصف

محادثة هاتفية غير مكتوبة بين شخصين. تقريبا. مدة الصوت (المدى) - 15-60 دقيقة ، العربية من دول الخليج.

الحلول المقترحة

ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة

تفاصيل مجموعة البيانات

مجموع الساعات

292

معدل العينة

8 كيلو هرتز

قناة الصوت

مزدوج

منصة التسجيل

الحاسوب

تنسيق الصوت

. الرعايا

تنسيق النسخ

.json

WER (٪)

5

ديموغرافيات مجموعة البيانات

الدولة

العربيه

اللغة

العربيه

الجنس

أنثى 838 ذكر 1209 مجهول 78

عدد مكبرات الصوت

706

العمر

18-50

نظرة عامة

العنوان

مجموعة بيانات اللغة العربية

نوع مجموعة البيانات

تحويل النص إلى كلام

الوصف

التسجيلات ذات النطق المنفرد ، والتي تميل إلى الانخفاض في نطاق 5 إلى 30 ثانية.

الحلول المقترحة

ASR ، مساعد افتراضي ، Chatbot ، AI للمحادثة ، تحليلات الكلام ، TTS ، نمذجة اللغة

تفاصيل مجموعة البيانات

مجموع الساعات

1,947

معدل العينة

48 كيلو هرتز

قناة الصوت

بالأبيض والأسود

منصة التسجيل

تطبيق الموبايل

تنسيق الصوت

. الرعايا

تنسيق النسخ

.json

WER (٪)

5

ديموغرافيات مجموعة البيانات

الدولة

العربيه

اللغة

العربيه

الجنس

أنثى 838 ذكر 1209 مجهول 78

عدد مكبرات الصوت

2,125

العمر

18-50

عملاء متميزون

تمكين الفرق لبناء منتجات ذكاء اصطناعي رائدة عالميًا.

Amazon
 جوجل
مایکروسوفت
شايب اتصل بنا

لا تستطيع أن تجد ما تبحث عنه؟

يتم جمع مجموعات بيانات جاهزة جديدة عبر جميع أنواع البيانات

اتصل بنا الآن للتخلص من مخاوفك المتعلقة بجمع بيانات التدريب على الصوت / الكلام

  • بالتسجيل ، أنا أتفق مع Shaip سياسة الخصوصية شروط الخدمة وأقدم موافقتي على تلقي اتصالات تسويقية B2B من Shaip.
  • هذا الحقل لأغراض التحقق من صحة وينبغي أن تترك دون تغيير.