Open-Generative-AI

في السنوات الأخيرة، أصبح إنشاء المحتوى باستخدام الذكاء الاصطناعي يعتمد بشكل كبير على عشرات المنصات المختلفة. فمرة نحتاج إلى موقع لتوليد الصور، ومرة أخرى إلى أداة لصناعة الفيديوهات، ثم منصة منفصلة لتحريك الصور، وأخرى لإنشاء الأصوات أو مزامنة الشفاه. ومع كل خدمة جديدة، نجد أنفسنا ندفع اشتراكات إضافية وننتقل بين عدة مواقع ومنصات.


لكن ماذا لو استطعنا بناء نظام تشغيل خاص بنا لتوليد المحتوى بالذكاء الاصطناعي؟ منصة واحدة تجمع مختلف النماذج والأدوات في مكان واحد، مع إمكانية التخصيص والتعديل الكامل؟
هذا بالضبط ما حاولنا استكشافه من خلال مشروع مفتوح المصدر يحمل اسم Open Generative AI.

فبدلاً من الاعتماد على نموذج واحد فقط، هذا المشروع مصمم ليعمل كمنصة تجمع العديد من نماذج الذكاء الاصطناعي المختلفة في واجهة واحدة، مثل:

  • توليد الصور بالذكاء الاصطناعي
  • تحويل النصوص إلى فيديوهات
  • تحويل الصور إلى فيديو
  • مزامنة حركة الشفاه (Lip Sync)
  • أدوات سينمائية لصناعة المشاهد
  • دعم نماذج فيديو متعددة مثل Kling وLuma وWan وHunyuan وغيرها
    بمعنى آخر، الفكرة لم تكن مجرد “مولد صور”، بل أقرب إلى:
    نظام تشغيل لإنشاء المحتوى باستخدام الذكاء الاصطناعي.
    بداية التجربة: تشغيل المشروع محلياً
    بعد تحميل الملفات المصدرية من GitHub، كانت الخطوة الأولى هي تشغيل المشروع محلياً على الحاسوب.
    قمنا بتثبيت الحزم المطلوبة باستخدام Node.js وتشغيل المشروع عبر الطرفية (Terminal)، ليبدأ الخادم المحلي بالعمل على رابط يشبه:
    http://localhost:3001
    وهنا ظهرت نقطة مهمة جداً.
    الكثير من المستخدمين يعتقدون أن تشغيل مشروع محلياً يعني أن كل شيء يعمل مباشرة على الجهاز دون الحاجة إلى خدمات خارجية، لكن الواقع مختلف قليلاً.
    فالمشروع كان يعمل محلياً من حيث الواجهة والنظام، لكن بعض عمليات التوليد كانت تعتمد على واجهات برمجية سحابية (APIs)، خاصة عند استخدام نماذج متقدمة لتوليد الصور والفيديو.
    بمعنى آخر:
  • واجهة الاستخدام تعمل على الجهاز
  • النظام نفسه يعمل محلياً
  • لكن بعض النماذج تحتاج إلى خوادم خارجية لتوليد النتائج
    العقبات الأولى: أخطاء الحزم المفقودة
    كأي مشروع مفتوح المصدر كبير، لم تكن التجربة خالية من المشاكل.
    واجهتنا في البداية أخطاء مرتبطة بحزم مفقودة داخل المشروع، مثل:
  • design-agent
  • workflow-builder
    وكانت هذه الوحدات مرتبطة بأجزاء ثانوية من النظام، مثل أدوات التصميم وبناء التدفقات (Workflows).
    بدلاً من الاستسلام أو التخلي عن المشروع، قمنا بتعطيل الوحدات غير الضرورية مؤقتاً والتركيز على الجزء الأساسي الذي يهمنا:
    استوديو إنشاء الصور والفيديوهات.
    وهنا تظهر إحدى أهم مزايا المشاريع مفتوحة المصدر:
    عندما تواجه مشكلة، يمكنك تعديل الكود بنفسك أو إزالة الأجزاء التي لا تحتاجها، بعكس المنصات المغلقة التي تفرض عليك طريقة استخدام محددة دون أي مرونة.
    أول تجربة حقيقية: استوديو الصور
    بعد تجاوز العقبات التقنية، نجحنا أخيراً في الوصول إلى لوحة التحكم الخاصة بالمشروع.
    ومن هناك بدأنا تجربة Image Studio، وهي واجهة مخصصة لإنشاء الصور باستخدام الذكاء الاصطناعي.
    قمنا بمحاولة إنشاء صورة مستوحاة من شخصيات NFT الشهيرة بأسلوب سينمائي ليلي، تتضمن:
  • قرد بأسلوب Yacht Monkey
  • أجواء ليلية على ضفاف نهر
  • نادٍ ليلي في الخلفية
  • جيتار وكوب قهوة
  • إضاءة سينمائية داكنة
    لكن هنا واجهتنا عقبة جديدة:
    الرصيد غير كافٍ لتوليد الصورة.
    وتبين أن بعض النماذج داخل النظام تعتمد على خدمة خارجية تُدعى Muapi.ai، والتي تحتاج إلى رصيد أو مفاتيح API لتشغيل بعض عمليات التوليد.
    ورغم ذلك، كانت التجربة مهمة لأنها أثبتت لنا شيئاً أساسياً:
    النظام نفسه يعمل بنجاح، والمشكلة لم تكن في الإعدادات أو التشغيل، بل فقط في الوصول إلى خدمات التوليد.
    ما الذي يجعل هذا المشروع مختلفاً عن مواقع الذكاء الاصطناعي العادية؟
    السؤال الأهم هنا:
    لماذا قد يختار شخص مشروعاً مفتوح المصدر بدلاً من استخدام موقع جاهز؟
    الإجابة تكمن في ثلاث نقاط رئيسية:
  1. الحرية الكاملة
    بدلاً من الاعتماد على منصة واحدة، يمكنك التنقل بين عدة نماذج حسب احتياجك.
    مثلاً:
  • فيديوهات واقعية → Kling
  • فيديوهات أسرع → LTX
  • نماذج محلية مجانية → Wan 2.2
  • أدوات سينمائية → Cinema Studio
  1. إمكانية التخصيص
    يمكنك تعديل النظام كما تريد.
    إضافة أدوات جديدة، إزالة أجزاء غير ضرورية، أو حتى بناء نظام مخصص لاحتياجاتك الخاصة.
  2. إمكانية بناء مشروعك الخاص
    الأمر لا يقتصر على الاستخدام الشخصي فقط.
    بل يمكن تطوير النظام وتحويله إلى منصة مستقلة أو خدمة SaaS مدفوعة، خاصة إذا كنت تعمل في صناعة المحتوى أو التسويق أو الفيديوهات القصيرة.
    الخلاصة: هل يستحق التجربة؟
    إذا كنت تبحث عن أداة سهلة تعمل بضغطة زر، فقد تكون المنصات التقليدية أسهل.
    أما إذا كنت تريد:
  • تحكماً أكبر
  • دعماً لعدة نماذج ذكاء اصطناعي
  • إمكانية التعديل والتخصيص
  • بيئة موحدة لصناعة المحتوى
ENJOYING THIS ARTICLE?

Get More AI News Like This, Every Week

Get the latest AI News, ChatGPT updates, AI tools, and future technology trends directly to your inbox.

No spam · Unsubscribe anytime