loading ad...
مؤخرًا، غصّت وسائل التواصل الاجتماعي بصور تبدو وكأنها خرجت من فيلم من إنتاج ستوديو غيبلي. صور سيلفي، صور عائلية، وحتى ميمز (meme) أعيد تخيلها بالألوان الهادئة والباستيلية المميزة لأعمال شركة الرسوم المتحركة اليابانية التي أسسها هاياو ميازاكي.اضافة اعلان
هذا جاء بعد التحديث الأخير الذي أجرته OpenAI على ChatGPT، حيث حسّن بشكل كبير قدرات توليد الصور في الأداة، مما أتاح للمستخدمين إنتاج صور بأسلوب غيبلي في ثوانٍ معدودة. وقد حظيت هذه الميزة بشعبية جارفة لدرجة أن النظام تعرّض لعطل مؤقت بسبب ضغط المستخدمين، وفقا لموقع "ذا كونفرسيشن".
أنظمة الذكاء الاصطناعي التوليدي مثل ChatGPT يمكن فهمها على أنها "محركات أسلوب" (style engines). وما نشهده الآن هو أن هذه الأنظمة باتت تتيح للمستخدمين دقة وتحكمًا غير مسبوقين في المخرجات.
لكن هذا التطور يفتح الباب أيضًا أمام أسئلة جديدة ومعقدة تتعلق بحقوق النشر وملكية الإبداع.
كيف يصنع ChatGPT الجديد الصور؟
تعمل برامج الذكاء الاصطناعي التوليدي من خلال إنتاج محتوى استجابةً لأوامر المستخدم، بما في ذلك الطلبات الخاصة بإنشاء صور.
في الإصدارات السابقة، اعتمدت مولدات الصور على نماذج تُعرف باسم نماذج الانتشار (Diffusion Models)، وهي تقوم بتكرير بيانات عشوائية وضوضائية تدريجيًا إلى أن تتشكل صورة واضحة ومتماسكة.
لكن التحديث الأخير لـChatGPT يستخدم ما يُعرف بـخوارزمية توليدية تسلسلية (Autoregressive Algorithm)، وهي مقاربة مختلفة جذريًا.
تعامل هذه الخوارزمية الصور بنفس الطريقة التي تتعامل بها مع اللغة، حيث تقوم بتقسيم الصورة إلى وحدات صغيرة تُعرف بـ"الرموز" أو "Tokens". وكما يتنبأ ChatGPT بالكلمات الأكثر احتمالًا في جملة، يمكنه الآن التنبؤ بعناصر بصرية مختلفة داخل الصورة بشكل مستقل.
هذه الطريقة في "ترميز الصور" تسمح للخوارزمية بفهم أفضل لخصائص محددة داخل الصورة، وعلاقتها بالكلمات الموجودة في الأمر النصي. والنتيجة؟ قدرة أكبر على توليد صور دقيقة وفقًا لتعليمات المستخدم، مقارنة بالجيل السابق من أدوات توليد الصور.
كما أن هذه التقنية تُسهّل عملية استبدال أو تعديل أجزاء محددة من الصورة مع الحفاظ على باقي العناصر، وتحسّن من دقة النصوص المضمّنة داخل الصور، وهي نقطة لطالما كانت تحديًا في النماذج السابقة.
وواحدة من أبرز مزايا توليد الصور من داخل نموذج لغوي كبير هي القدرة على الاستفادة من المعرفة المضمّنة مسبقًا في النموذج. هذا يعني أن المستخدم لا يحتاج إلى شرح كل تفصيل صغير في الصورة. يمكنه ببساطة أن يطلب صورة "بأسلوب ستوديو غيبلي"، وسيفهم الذكاء الاصطناعي المرجع فورًا.
وبدأت موضة صور "ستوديو غيبلي" مؤخرًا من داخل OpenAI نفسها، قبل أن تنتشر بين مهندسي البرمجيات في وادي السيليكون، ثم تجد طريقها إلى الحكومات والساسة أيضًا.
ومن بين الاستخدامات اللافتة: البيت الأبيض استخدم هذه التقنية لإنتاج صورة بأسلوب غيبلي تُظهر امرأة تبكي أثناء ترحيلها. والحكومة الهندية استخدمتها في الترويج لرؤية رئيس الوزراء ناريندرا مودي لما يُعرف بـ"الهند الجديدة".
فهم الذكاء الاصطناعي كنظم "توليد الأساليب"
لا تخزّن أنظمة الذكاء الاصطناعي التوليدي المعلومات بالطريقة التقليدية المعتادة. بدلاً من ذلك، تقوم بترميز النصوص، والحقائق، وقطع الصور ضمن أنماط – أو ما يُعرف بـ"الأساليب" (styles) – داخل شبكاتها العصبية.
وبفضل التدريب على كميات هائلة من البيانات، تتعلم هذه النماذج التعرّف على الأنماط على مستويات متعددة.
الطبقات السفلى من الشبكة العصبية قد تلتقط سمات بسيطة مثل العلاقات بين الكلمات أو نسيج الصور.
أما الطبقات العليا، فتقوم بترميز مفاهيم أكثر تعقيدًا أو عناصر بصرية متكاملة.
وهذا يعني أن كل شيء – الأشياء، الخصائص، الأنواع الأدبية، وحتى نبرة الكتابة المهنية – يتم تحويله إلى أسلوب يمكن للنموذج فهمه وإعادة توليده.
فعلى سبيل المثال، عندما يتعلّم الذكاء الاصطناعي عن أعمال ميازاكي (مؤسس ستوديو غيبلي)، فهو لا يقوم بحفظ لقطات معينة من أفلام الاستوديو (رغم أن بعض الصور المنتجة قد تبدو قريبة جدًا من اللقطات الأصلية).
بل يقوم بترميز ما يمكن تسميته بـ"روح غيبلي" أو "Ghibli-ness" على شكل نمط رياضي يمكن تطبيقه لاحقًا على صور جديدة.
الأمر نفسه ينطبق على مفاهيم مثل "موز"، "قطة"، أو "رسالة بريد إلكتروني رسمية". حيث يتعلّم النموذج "جوهر الموز"، أو "طبيعة القطة"، أو "نمط المراسلات المهنية" كأنماط قابلة للتطبيق.
ولطالما كان ترميز الأساليب ونقلها هدفًا صريحًا في أبحاث الذكاء البصري. واليوم، لدينا مولّد صور قادر على تحقيق هذا الهدف بمستوى غير مسبوق من الدقة والتحكّم.
هذه المقاربة تفتح آفاقًا مذهلة في الإبداع، سواء على مستوى النصوص أو الصور. فبما أن كل شيء أصبح "أسلوبًا"، يمكن الآن دمج هذه الأساليب بحرية وتبادلها. ولهذا السبب، نُطلق على هذه النماذج وصف "محركات الأسلوب" (Style Engines).
جرب مثلًا أن تطلب من النموذج توليد صورة لـ"كرسي بذراعين بأسلوب قطة"، أو "كرسي على الطراز الإلفي (elvish)" – وستُذهلك النتيجة.
جدل حقوق النشر: حين تتحول "الأساليب" إلى هوية فنية
رغم أن القدرة على التعامل مع الأساليب الفنية هي ما يمنح الذكاء الاصطناعي التوليدي قوته الإبداعية، فإنها أيضًا تقع في صميم جدل متصاعد. بالنسبة لكثير من الفنانين، من المزعج بشدة أن يُختزل أسلوبهم الفني الفريد إلى مجرد "نمط" يمكن لأي شخص استخدامه عبر أمر نصي بسيط.
حتى الآن، لم يُدلِ هاياو ميازاكي، المخرج الياباني الشهير ومؤسس ستوديو غيبلي، بأي تعليق علني بشأن ظاهرة توليد الصور بأسلوبه الفني باستخدام ChatGPT. لكنه عبّر سابقًا عن انتقادات تجاه تقنيات الذكاء الاصطناعي.
وهذا كله يثير أسئلة جديدة بالكامل تتعلق بحقوق النشر والملكية الإبداعية.
بشكل عام، لا تحمي قوانين حقوق النشر الأسلوب الفني بحد ذاته، بل تحمي فقط التعبيرات المحددة عنه.
لا يمكنك، على سبيل المثال، تسجيل حقوق ملكية فكرية على نوع موسيقي مثل "السكّا"، أو على حركة فنية مثل "الانطباعية".
وهذا القيد القانوني له ما يبرره؛ إذ إن احتكار أحدهم لأسلوب فني بالكامل قد يؤدي إلى خنق الإبداع لدى الآخرين.
لكن ثمة فارق بين الأساليب العامة وتلك التي أصبحت مميزة جدًا لدرجة ارتباطها بهوية شخصية لفنان بعينه.
فعندما يصبح بإمكان الذكاء الاصطناعي توليد صور "بأسلوب غريغ راتكوفسكي" – وهو فنان بولندي ذُكر اسمه في أكثر من 93,000 طلب ضمن مولد الصور Stable Diffusion – فإن ذلك يشكل تهديدًا مباشرًا لمصدر رزقه وإرثه الفني.
تحرك قانوني
بالفعل، بدأ بعض المبدعين باتخاذ خطوات قانونية.
في أواخر عام 2022، رفع ثلاثة فنانين دعوى قضائية جماعية ضد عدة شركات ذكاء اصطناعي، بدعوى أن مولدات الصور التابعة لها تم تدريبها على أعمالهم الأصلية دون إذن، وهي الآن تتيح للمستخدمين توليد أعمال مشتقة تحاكي أساليبهم الفنية الفريدة.
ومع تسارع التطور التكنولوجي مقارنة بتباطؤ القانون، يجري العمل حاليًا على إعداد تشريعات جديدة تحاول الموازنة بين الابتكار التقني وحماية الهوية الإبداعية للفنانين.
أياً كانت نتيجة هذه القضايا، فإن هذا الجدل يكشف عن طبيعة الذكاء الاصطناعي التحويلية، ويدعو إلى التأمل في جوانب متعددة منها الإمكانيات الإبداعية الهائلة لمحركات "الأسلوب"، والحاجة الماسّة لوضع ضوابط قانونية دقيقة تحمي الأساليب الفنية المميزة من الانتهاك أو الاستغلال التجاري غير العادل.
0 تعليق