فيديو: كيف تُشغّل تطبيقات ذكاء اصطناعي متعددة الوسائط بأقل التكاليف؟ قصة Whering مع Google

تطبيق أزياء ذكي يعتمد على نماذج Google المتعددة الوسائط يثبت أن الجمع بين الرؤية الحاسوبية وتوليد الصور يمكن أن يكون فعالاً من حيث التكلفة. تعرف على الحلول التي ابتكرها فريق Whering لموازنة الأداء والنفقات.

عندما تبدأ شركة ناشئة في بناء تطبيق يعتمد على نماذج ذكاء اصطناعي متعددة الوسائط – كالرؤية الحاسوبية وتوليد الصور معًا – يكون أول ما يخطر ببال المهندسين هو التكلفة الباهظة لمعالجة هذه الأحمال. ولكن هل يمكن تحقيق تجربة شخصية سلسة على الهاتف دون حرق الميزانية؟ هذا ما حاولت شركة Whering، المتخصصة في تطبيق أزياء ذكي، إثباته بالتعاون مع Google Cloud.

ما الذي تفعله Whering بالضبط؟

Whering ليس مجرد تطبيق عادي لاختيار الملابس؛ إنه منصة شخصية تعتمد على الذكاء الاصطناعي لتحليل خزانة المستخدم، اقتراح تنسيقات جديدة، وحتى تعديل الصور عبر توليد خلفيات شفافة أو تغيير ألوان القطع. لتحقيق ذلك، تدمج Whering بين إطارات الرؤية الحاسوبية (Computer Vision) ونماذج توليد الصور (Image Generation) من Google، مما يجعل التطبيق قادرًا على وضع العلامات الآلية للمخزون (auto-tagging)، تحليل الألوان، وفصل طبقات الخلفية بسرعة.

كيف خفّضت Whering التكاليف دون التضحية بالأداء؟

خلال مقابلة في مؤتمر Google I/O، أوضحت Bianca Rangecroft، المؤسسة والرئيسة التنفيذية لـ Whering، أن السر يكمن في استخدام استراتيجيتين أساسيتين:

1. ميزات الحافة منخفضة الكمون – Nano

بدلاً من إرسال كل عملية معالجة إلى السحابة، تستفيد Whering من نموذج Nano الذي يعمل مباشرة على جهاز المستخدم (edge device). هذا النموذج الخفيف يتولى مهام مثل التعرف الأولي على القطع وتحليل الألوان دون الحاجة إلى اتصال دائم بالإنترنت، مما يقلل زمن الاستجابة ويخفض تكاليف الحوسبة السحابية.

2. الجدار الذكي (Intelligent Walling)

المشكلة الكبرى في التطبيقات متعددة الوسائط هي أن بعض العمليات – مثل توليد صورة جديدة بقص الخلفية – تستهلك طاقة حوسبة هائلة. هنا لجأت Whering إلى ما يسمى Intelligent Walling: وهو نظام ذكي يقرر متى وأي مهمة تُنفّذ على الجهاز، ومتى تُحوَّل إلى السحابة. فالمهام البسيطة (كالتعرف على اللون) تبقى محلية، بينما المهام الثقيلة (كتوليد خلفيات عالية الدقة) تُرسل إلى نماذج Google المتقدمة في السحابة. هذا التوازن يمنع تراكم فواتير الحوسبة الباهظة.

دروس للمطورين والشركات الناشئة العربية

ما تقدمه Whering ليس مجرد حل لتطبيق أزياء، بل إطار عمل يمكن لأي فريق اعتماده عند بناء تطبيقات ذكاء اصطناعي متعددة الوسائط:

استخدم نماذج خفيفة للحافة أولاً: ابدأ بـ Nano أو نماذج مماثلة لتقليل الاعتماد على السحابة في المهام الروتينية.
طبّق نظام توجيه ذكي (Walling): بدلاً من معالجة كل شيء في السحابة، اجعل التطبيق يقرر بنفسه أين سيتم تنفيذ المهمة بناءً على تعقيدها وحساسية الوقت.
استفد من نماذج Google الجاهزة: بدلاً من بناء نموذج من الصفر، يمكن للمطورين استخدام النماذج التأسيسية (Foundation Models) مثل نموذج معالجة الصور والرؤية الحاسوبية من Google، مما يختصر وقت التطوير ويخفض التكاليف.
راقب تكلفة البضائع المحوسبة (COGs): كل مهمة حوسبة لها ثمن، لذا احسب دائمًا تكلفة كل عملية (COGs) قبل إطلاقها للمستخدمين.

ماذا يعني هذا للمستخدم النهائي؟

بالنسبة لمستخدم التطبيق، النتيجة النهائية هي تجربة سريعة وشخصية دون تأخير مزعج. على سبيل المثال، عندما يلتقط المستخدم صورة لقميص جديد، يتم تحليل لونه وشكله فورًا على الجهاز، ثم يُقترح تنسيق كامل مع بنطال موجود في الخزانة، ويتم توليد صورة مركبة بجودة عالية خلال ثوانٍ. كل هذا يحدث بتكلفة حوسبة منخفضة تسمح للشركة الناشئة بالاستمرار دون حرق ميزانيتها.

الخلاصة العملية

Whering تثبت أن الجمع بين الرؤية الحاسوبية وتوليد الصور ليس حكرًا على الشركات العملاقة. باستخدام الاستراتيجيات الصحيحة – نماذج الحافة، التوجيه الذكي، والاستفادة من البنية التحتية السحابية بشكل انتقائي – يمكن لأي فريق تطوير تطبيق ذكاء اصطناعي متعدد الوسائط بتكلفة معقولة. بالنسبة للمطورين العرب، هذه حالة دراسية ملهمة تفتح الباب أمام الابتكار في مجالات مثل الموضة، التجارة الإلكترونية، أو حتى الرعاية الصحية، دون الخوف من فواتير السحابة الخيالية. المفتاح هو أن تبدأ صغيرًا، تفكر في الحافة، وتثق في الذكاء التوجيهي لاتخاذ القرار الصحيح في الوقت المناسب.

مصدر المقطع

نشر المقطع على قناة Google Cloud Tech في YouTube، وتم اختياره لأنه حديث ومرتبط بموضوعات عليها طلب في الذكاء الاصطناعي.