هوش مصنوعی فارسی چیست و چطور کار میکند؟
از مدل زبانی تا چتبات فارسی: به زبان ساده توضیح میدهیم هوش مصنوعی چطور فارسی یاد گرفته، چرا بعضی ابزارها فارسی را خراب مینویسند و چه چیزی یک سرویس را واقعاً «فارسی» میکند.
وقتی میگوییم «هوش مصنوعی فارسی»، منظور یک مدل جداگانه نیست که فقط برای زبان فارسی ساخته شده باشد. مدلهای زبانی بزرگ مثل GPT-4o و Claude روی متن دهها زبان آموزش دیدهاند و فارسی هم یکی از آنهاست. تفاوت اصلی در «چقدر خوب» است: حجم دادهٔ فارسیِ باکیفیت در اینترنت نسبت به انگلیسی کم است، بنابراین کیفیت فارسیِ هر مدل به معماری، دادهٔ آموزشی و تنظیم نهایی آن بستگی دارد.
مدل زبانی چطور «میفهمد»؟
مدل زبانی در سطح میلیاردها جمله الگو یاد میگیرد: بعد از این کلمهها، معمولاً چه میآید؟ همین پیشبینی ساده وقتی در مقیاس عظیم انجام شود، به رفتاری میرسد که شبیه فهمیدن است — مدل میتواند خلاصه کند، ترجمه کند، استدلال کند و کد بنویسد. برای فارسی، مدل همان الگوها را از متنهای فارسی (و از دانشی که از زبانهای دیگر منتقل میشود) یاد گرفته است. به همین دلیل مدلهای جدیدتر و بزرگتر معمولاً فارسیِ روانتری دارند.
چرا بعضی ابزارها فارسی را خراب میکنند؟
مشکل معمولاً از مدل نیست، از محصول است. متن فارسی راستبهچپ است اما کد و لینک چپبهراستاند؛ اگر رابط کاربری این را درست مدیریت نکند، خروجی بههم میریزد. اعداد، نیمفاصله، «ی» و «ک» عربی، و شکستن خط در جای غلط هم دردسرهای رایجاند. یک سرویس واقعاً فارسی باید هم مدل خوب انتخاب کند، هم پرامپت سیستمی فارسی بدهد و هم رابط RTL تمیز داشته باشد — با بلوک کد جدا، ارقام فارسی و تقویم جلالی.
دسترسی: مسئلهٔ مخصوص کاربر ایرانی
بهترین مدلهای دنیا برای کاربر ایرانی مسدودند: ChatGPT و Claude بدون تحریمشکن باز نمیشوند، پرداخت دلاری ممکن نیست و حسابها بیدلیل بسته میشوند. راهحل سرویسهایی مثل خِرَد این است که درخواستها را از سرورهای واسط خودشان عبور میدهند: تو با یک سایت ایرانی کار میکنی، پرداخت ریالی است و مدل خارجی هرگز نمیداند درخواست از کجا آمده.
جمعبندی: «هوش مصنوعی فارسی» یعنی ترکیب سه چیز — مدل قوی با فارسی روان، رابط کاربری که راستبهچپ را جدی گرفته، و دسترسی بدون دردسر از داخل ایران. موقع انتخاب سرویس، هر سه را بسنج: یک پاراگراف فارسی با کد و عدد از آن بگیر و ببین نتیجه چقدر تمیز است.