إرث العربية. وذكاء المستقبل.
نُقدّم كَون، المنصة الرائدة في مجال الذكاء الاصطناعي، المصمّمة خصيصًا لفهم عمق وتعقيد اللغة العربية. تجمع كَون بين قوة أحدث نماذج الذكاء الاصطناعي التوليدي وتقدير عميق لإرثنا اللغوي، لتضع بين يديك أداة لا مثيل لها للإبداع، والتحليل، والتواصل.
الرؤية
أن نصبح المنصة الرائدة في مجال الذكاء الاصطناعي المرتكز على اللغة العربية، عبر تطوير نماذج لغوية تدرك عمق الثقافة العربية، وتمكّن الأفراد والمؤسسات من أدوات ذكية تعزز الإبداع، والتحليل، والتواصل—في العالم العربي وخارجه.
الرسالة
في كَون، نؤمن بأن اللغة ليست مجرد كلمات، بل هي هوية وثقافة. ولهذا نطوّر حلول ذكاء اصطناعي متقدمة تدرك الفروق الدقيقة في اللغة العربية وتتكيّف مع سياقاتها المتنوعة. نهدف إلى تقديم منصة موحّدة تدعم الإبداع، والفهم، والتحول الرقمي بطريقة تتوافق ثقافيًا وتقنيًا مع احتياجات المستخدمين.
الدلالات الكامنة وراء الاسم
الاسم "كَون" ليس مجرد كلمة؛ بل هو فلسفتنا. تعني الكلمة "الوجود" نفسه، وهي تعكس جوهر رسالتنا: بناء ذكاء اصطناعي يفهم اللغة العربية بجميع أبعادها ووجودها الحقيقي—من لهجاتها المتنوعة إلى سياقاتها الثقافية العميقة. لكن "كَون" (الكون) يرمز أيضًا إلى الشمول والامتداد. ومن هذا المنطلق، فإن هدفنا لا يقتصر على فهم اللغة كما هي، بل توسيع إمكاناتها، وتقديم حلول تتجاوز الحدود، وبناء جسور للتواصل بين مختلف المجالات والثقافات.
القيم الجوهرية
كَون، نموذج لغوي ضخم (LLM) متخصص في اللغة العربية، يسعى إلى دمج العمق اللغوي مع الابتكار التقني. وتشمل القيم الأساسية ما يلي:
إتاحة الوصول والشمولية
تعزّز كون الوصول إلى اللغة العربية لغير الناطقين بها، وتدعم الناطقين بها، مما يسهم في تعزيز الفهم الثقافي والشمولية.
التمكين التعليمي
تركّز كون على التعليم، من خلال توفير أدوات ورؤى قيّمة للمتعلمين والمعلمين في تعلم اللغات، والدراسات الثقافية، والبحث الأكاديمي.
الذكاء الاصطناعي الأخلاقي والمسؤولية الاجتماعية
تلتزم كون بالذكاء الاصطناعي الأخلاقي، من خلال ضمان خصوصية البيانات، وتقليل التحيّزات، وتعزيز الاستخدام المسؤول للتقنية.
الأصالة الثقافية واللغوية
تلتزم كون بالذكاء الاصطناعي الأخلاقي، من خلال ضمان خصوصية البيانات، وتقليل التحيّزات، وتعزيز الاستخدام المسؤول للتقنية.
ما الذي يميزنا؟
التزامنا بالبحث المفتوح
نحن ملتزمون بتمكين مجتمع البحث من خلال مشاركة نتائجنا ومجموعات البيانات والمعايير المرجعية، لدعم العلم المفتوح وتسريع التقدم في الذكاء الاصطناعي العربي.
بيانات مسراج المفتوحة
أكثر من 35 مليار توكن عربي من محتوى متنوع (ويب، رؤيا، ترجمات)
عرض مجموعة البياناتSadeedDiac-25
معيار تقييم جودة التشكيل على نصوص عربية كلاسيكية وحديثة (1,200 جملة)
عرض مجموعة البياناتTarjama-25
معيار تقييم لأنظمة الترجمة الآلية، يضم أكثر من 5,000 جملة مدققة يدويًا، في مجالات متعددة
عرض مجموعة البيانات