پیشبینی کیفیت و فرمولاسیون پنیر پیتزا

مقدمه
این مقاله به تشریح فرآیند پیادهسازی پروژه پیشبینی کیفیت و فرمولاسیون پنیر پیتزا برای شرکت فرنان میپردازد. در طول این مقاله، مراحل مختلف پروژه از جمعآوری دادهها تا استقرار مدل هوش مصنوعی مورد بررسی قرار میگیرد. همچنین به بررسی مزایای استفاده از مدلهای هوش مصنوعی برای بهبود فرآیند تولید و افزایش کیفیت محصولات پرداخته خواهد شد. در ادامه، دادههای استفادهشده، مراحل تمیزسازی و پردازش دادهها، انتخاب و ارزیابی مدل، آموزش و آزمون مدل و در نهایت استقرار و بهروزرسانی مدل با دادههای جدید نیز بهتفصیل بیان میشوند.
بیان مسئله و شرح خلاصه از این مقاله
صنعت مواد غذایی به دلیل ماهیت حساس و پیچیده فرآیند تولید و اهمیت کیفیت محصول نهایی، نیازمند کنترل دقیق و بهینه سازی فرمولاسیون است. این قائده در رابطه با شرکت های تولید پنیر پیتزا نیز صدق می کند و به دلیل پویایی فرآیند تولید این محصول، این مهم از اهمیت دو چندانی برخوردار می شود. بهبود کیفیت محصول با کمک مدل های هوش مصنوعی می تواند گامی تاثیر گذار در جهت افزایش بهره وری و رقابت پذیری باشد.
شرکت فرنان پخت یکی از تولید کنندگان پیشرو در صنعت مواد غذایی و به خصوص پنیر پیتزا در ایران است. این شرکت با بهره گیری از تجربه و تکنولوژی، به تولید محصولات با کیفیت و متنوع در بازار داخلی و خارجی می پردازد. با توجه به اهمیت بالای کیفیت در تولید پنیر پیتزا و نقش حیاتی آن در رضایت مشتریان و موفیقت تجاری، شرکت فرنان تصمیم گرفت تا با استفاده از تکنولوژی هوش مصنوعی، فرآیند تولید خود را بهینه سازی کند.
در این مقاله به پروژه ای پرداخته می شود که در طی آن مدل هوش مصنوعی برای پیش بینی کیفیت پنیر پیتزا و پیشنهاد فرمولاسیون بهینه جهت تولید محصول، طراحی و پیاده سازی شده است. این مدل به فرنان کمک می کند تا با استفاده از داده های تولید و داده های کنترل و تضمین کیفیت، دقت پیش بینی را افزایش داده و بهره وری کلی تولید را بهبود بخشد.
شرح پروژه
در ابتدا با مدیران شرکت فرنان مصاحبه صورت گرفت و اهداف آن ها از این پروژه مشخص شد. سپس داده های مربوط به فرآیند تولید پنیر پیتزا جمع آوری شد که شامل اطلاعات مربوط به مقادیر مواد اولیه پنیر پیتزا به مدت دو سال، همراه با داده های تضمین و کنترل کیفیت بوده است. از داده های مقدار مواد اولیه برای پیش بینی کیفیت محصول نهایی استفاده شده است و از داده های کنترل کییفت برای پیش بینی مقدار و پیشنهاد فرمولاسیون تولید بهره گرفته شده است.
مدل پیش بینی کیفیت این طور عمل می کند که ابتدا باید مقدار مواد اولیه به مدل ارائه شود و خروجی آن پیش بینی کیفیت نهایی محصول بر اساس این مقادیر خواهد بود. به عبارت دیگر، مدل مشخص می کند که اگر با مقادیر داده شده تولید صورت گیرد، کیفیت نهایی محصول چگونه خواهد بود. همچنین برای استفاده از مدل پیش بینی فرمولاسیون، باید داده های مربوط به کیفیت محصول مورد نظر به مدل داده شود تا مدل بر اساس این داده ها، پیشنهاد مقادیر مواد اولیه را برای تولید محصول ارائه کند.
برای تولید پنیر پیتزا، ۱۳ الی ۱۵ ماده اولیه مورد استفاده قرار می گیرید. پارامتر های کیفیت محصول نهایی نیز شامل Ph محصول، امتیاز کشسانی، نفوذ پذیری، ذوب پذیری، رنگ_طعم_بو، سطح روغن و وزن محصول می باشد. مدل پیش بینی کیفیت بر اساس داده های مواد اولیه، این پارامتر های کیفیتی را پیش بینی می کند و مدل پیش بینی فرمولاسیون نیز با دریافت داده های مربوط به وزن و کیفیت مورد انتظار، مقادیر مواد لازم را برای رسیدن به آن کیفیت ارائه می دهد.

جمع آوری داده ها و منابع داده
برای جمع آوری داده های مورد نیاز پروژه، تیم هوش مصنوعی فکور صنعت با طراحی یک فرم دیجیتال ( eForm ) به بهینه سازی ثبت داده ها پرداخت. به دلیل این که داده ها پیش تر به صورت کاغذی و دستی ثبت می شدند، وارد کردن آن ها به دیتاست به صورت دستی، زمان بر است و امکان دارد تا ددلاین پروژه به تعویق بیافتند؛ به همین منظور، با طراحی و استقرار یک فرم دیجیتال، امکان ثبت داده ها به صورت آنلاین فراهم شد.
این فرم دیجیتال داده ها را بطور مستقیم وارد دیتاست می کند و علاوه بر ثبت داده ها در دیتا سنتر شرکت فرنان، امکان ورود داده ها به مدل هوش مصنوعی را نیز فراهم می سازد. هدف از این کارکاهش مصرف کاغذ و ملزومات مرتبط آن و همچنین دسترسی بلادرنگ به داده ها برای انجام تحلیل ها و به روزرسانی مداوم مدل بوده است. با این سیستم، مدل می تواند با داده های جدید آموزش ببیند و پیش بینی های خود را بر اساس اطلاعات به روز انجام دهد و نتایج را در لحظه ارائه کند.
از طریق این فرم دیجیتال، ۱۵ ماده اولیه و پارامتر های کیفیت محصول جمع آوری و برای مدل سازی آماده شدند. تمامی داده های مورد استفاده؛ از منابع داده ای شرکت فرنان پخت جمع آوری شده و مدل بر اساس داده های تولید پنیر پیتزای این شرکت ساخته شده است. همچنین داده های پیشین تولید پنیر پیتزا، توسط تیم هوش مصنوعی شرکت فکور صنعت تمیزسازی شده اند. با استفاده از برنامه نویسی پایتون، داده های مورد نیاز از میان بالک دیتا ( Bulk data ) استخراج و برای مدلسازی به دیتاست اضافه شد.
تمیز کردن داده ها
برای آماده سازی داده ها جهت استفاده در مدل های پیش بینی، فرآیند تمیز کردن داده ها با استفاده از کد های پایتون و کتابخانه های مربوطه ( libraries ) انجام شد. در این بخش، هدف اصلی حذف داده های غیر ضروری، شناسایی و اصلاح مقادیر خالی ( NaN value, Missing value )، و اطمینان از سازگاری فرمت داده ها برای مدل سازی بود. مراحل این فرآیند به شرح زیر است:
وارد کردن داده ها: ابتدا داده ها از طریق کتابخانه pandas و با استفاده از کد زیر وارد شدند و در یک dataframe ذخیره شدند:
Import pandas as pd
Df = pd.read_excel ( “file_path”)
Df = pd.read_excel ( “file_path”)
حذف داده های غیر ضروری: در این مرحله، ستون ها و داده هایی که برای مدل سازی ضروری نبودند از دیتافریم حذف شدند:
Df = df.drop ([“unnecessary_column1”, “unnecessary_column2”], axis = 1)
شناسایی مقادیر خالی: برای بررسی مقادیر خالی ( missing یا Null ) در داده ها، از کد زیر استفاده شد تا ستون ها و ردیف هایی که دارای مقادیر خالی بودند شناسایی شوند:
()Df.isnull().sum
تغییر فرمت داده ها: در این مرحله، فرمت داده های ستون ها بررسی و به نوع مورد نیاز ( Float64 ) تبدیل شدند. ابتدا فرمت هر ستون مشخص شدند و سپس داده ها به فرمت مورد نیاز تبدیل شدند:
()Df.dtypes
Df= df.astype({“column_name” : “float64”})
پر کردن داده های خالی یا missing value: برای ستون هایی که دارای مقادیر خالی بودند، به منظور حذف تعداد کافی داده ها برای مدل سازی، از دو روش استفاده شد:
Df= df.dropna( subset= [“column_with_few_missing_values”])
پر کردن مقادیر خالی با میانگین ستون مورد نظر، به خصوص برای ستون هایی که درصد زیادی از مقادیر خالی داشتند:
Df[“column_name”].fillna(df[“column_name”].mean(), inplace= True)
این فرآیند تمیز سازی این اجازه را می دهد تا تعداد کافی از داده های تمیز و مناسب را برای مدل سازی در اختیار داشته باشیم. این رویکرد ترکیبی از حذف و پرکردن مقادیر خالی، باعث شد نه تنها از افت کیفیت داده ها جلوگیری شود، بلکه مدل بتواند بر اساس داده های کامل تری آموزش ببیند و پیش بینی های دقیق تری انجام دهد.
پردازش و نرمال سازی داده ها:
پس از تمیز سازی داده ها، مرحله پردازش داده ها آغاز شد تا داده ها به شکلی آماده شوند که برای مدل سازی بهینه باشند. در این پروژه، از نرمال سازی داده ها استفاده شد تا داده های ورودی در یک مقیاس یکسان قرار گیرند و دقت پیش بینی مدل افزایش یابد.
داده ها شامل مقادیر مربوط مواد اولیه تولید پنیر پیتزا بودند که با واحد کیلوگرم ثبت شده بودند. از آنجا که مقیاس مقادیر اولیه می تواند تاثیر منفی بر دقت مدل داشته باشد، فرآیند نرمال سازی برای قرار دادن داده ها در یک مقیاس استاندارد انجام شد.
برای نرمال سازی داده ها از کتابخانه sklearn.preprocessing و ابزار standardScaler استفاده شد. این ابزار داده ها را به گونه ای تغییر می دهد که میانگین آن برابر با صفر و انحراف از معیار آن برابر با یک باشد، که در نتیجه داده ها به صورت استاندارد در می آیند.
داده ها به دو قسمت تقسیم شدند:
-
X: داده های ورودی که شامل مواد اولیه تولید پنیر پیتزا می باشند.
-
Y: داده های پیش بینی که شامل پارامتر های کیفیت محصول می باشند.
نرمال سازی داده ها با استفاده از کد های زیر انجام شدند:
from sklearn.preprocessing import StandardScaler
()ss=StandardScaler
x= ss.fit_transform(df_inpudata)
y=ss.fit_transform(df_predictiondata)
نتیجه نرمال سازی:
با انجام این فرآیند، داده ها به یک مقیاس استاندارد تبدیل شدند که باعث شد مدل بتواند دقت بالاتری در پیش بینی ها داشته باشد و از تاثیر منفی متفاوت در مقیاس داده ها جلوگیری شود. این مرحله داده ها را آماده ورود به مدل می کند و از کاهش دقت به دلیل تفاوت در مقیاس ها جلوگیری می کند. نرمال سازی، یکی از گام های اساسی برای اطمینان از کارایی و عملکرد بهتر مدل در پیش بینی است.
انتخاب مدل
برای انتخاب بهترین مدل یادگیری ماشین جهت پیش بینی کیفیت و فرمولاسیون تولید پنیر پیتزا، چندین مدل یادگیری ماشین مورد بررسی و ارزیابی قرار گرفتند. این فرآیند شامل گام های زیر بوده است:
مدل های مورد بررسی
طبق تحقیقات انجام شده، چهار مدل یادگیری ماشین برای این پروژه در نظر گرفته شدند:
-
Random forest
-
Decision tree
-
XGBoost
-
KNN
تقسیم داده ها
برای ارزیابی مدل ها، داده های ورودی (x) و خروجی (Y) به دو بخش آموزش و آزمون تقسیم شدند. از ابزار train_test_split کتابخانه sklearn برای تقسیم داده ها استفاده شد:
آموزش و پیش بینی مدل ها
هر مدل بر روی داده های آموزشی، آموزش داده شدند و سپس پیس بینی هایی بر روی داده های آزمون و آموزش انجام گرفت:
ml.model.fit(x_train, y_train)
Y_pred_test=ml_model.predict(x_test)
مصور سازی توزیع داده ها
برای ارزیابی عملکرد مدل ها، توزیع داده های پیش بینی شده و داده های واقعی با استفاده از کتابخانه seaborn و نمودار distribution plot بررسی شد. هدف از این مصور سازی، بررسی همپوشانی توزیع داده های واقعی و پیش بینی می باشد.
معیار های ارزیابی مدل
مدل ها با استفاده از معیار های زیر ارزیابی شدند:
-
Mean Squared Error (MSE): برای اندازه گیری میزان خطا.
-
R2 Score: برای ارزیابی قدرت پیش بینی مدل.
این امتیازات برای هر مدل بررسی و مقایسه شدند:
from sklearn.metrics import mean_squared_error, r2_score
mse = mean_squared_error(y_test,y_pred_xtest)
R2 =r2_score(y_test,y _pred_xtest)
انتخاب مدل نهایی
در نهایت مدل decision tree به عنوان بهترین مدل انتخاب شد:
-
کمترین مقدار MSE برابر با ۰٫۰۱۰۹
-
بالا ترین مقدار R2 برابر با ۰٫۹۸۹۰
-
نمودار توزیع آماری با بیشترین همپوشانی بین داده های واقعی و پیش بینی شده.
این مدل برای پیش بینی کیفیت و فرمولاسیون تولید پنیر پیتزا در پروژه استفاده شد. عملکرد بالای decision tree در این پروژه نشان دهنده توانایی بالای آن در کار با داده های پیچیده و پیش بینی های دقیق است.
ارزیابی مدل انتخاب شده و آموزش و آزمون ( Train & Test ):
پس از انتخاب مدل decision tree به عنوان مدل نهایی، این مدل مجددا با داده های آموزش و آزمون ارزیابی و مدل سازی شد تا صحت عملکرد آن در پیش بینی کیفیت و فرمولاسیون تولید تایید شود.
نتایج مدل سازی و ارزیابی مجدد نشان داد که مدل همچنان عملکرد مطلوبی را حفظ کرده است و مقادیر ارزیابی همچنان به شرح زیر است:
-
MSE: 0.0109
-
R2Score: 0.9890
این مرحله اطمیان حاصل کرد که مدل انتخاب شده، نه تنها در داده های آموزشی بلکه در داده های آزمون نیز عملکرد بسیار مطلوبی دارد.
استقرار مدل و توسعه مدل با داده های جدید
پس از آموزش و ارزیابی موفقیت آمیز مدل، گام بعدی استقرار آن در شرکت فرنان بوده است تا امکان به روزرسانی مداوم مدل با داده های جدید ایجاد شود.
اتصال مدل به فرم دیجیتال
فرم دیجیتال طراحی شده نقش کلیدی در استقرار مدل داشته است. این فرم علاوه بر ثبت داده ها در دیتاست، به مدل هوش مصنوعی نیز متصل شد. هر زمان که داده های جدید در فرم دیجیتال وارد می شوند:
-
داده ها بصورت بلادرنگ ( Real-Time ) به مدل ارسال می شوند.
-
مدل این داده ها را برای پیش بینی دقیق تر و آموزش مجدد خود استفاده می کند.
این اتصال باعث شد که مدل به صورت پویا و مداوم با داده های جدید یاد بگیرد و عملکرد خود را بهبود بخشد.
طراحی وب اپلیکیشن با Streamlit
برای ساده سازی استفاده از مدل برای کاربران شرکت فرنان، یک وب اپلیکیشن با استفاده از کتابخانه Streamlit طراحی شد. این وب اپلیکشین به کاربران اجازه می دهد:
-
به راحتی وارد سیستم شوند.
-
مقادیر ورودی ( مانند مواد اولیه تولید پنیر پیتزا یا پارامتر های کیفیت مورد انتظار ) را وارد کنند.
-
خروجی مدل شامل پیش بینی کیفیت و پیشنهادات فرمولاسیون را مشاهده کنند.
ویژگی های کلیدی وب اپلیکیشن:
-
رابط کاربری ساده و کاربر پسند: کاربر می تواند بدون نیاز به دانش فنی، داده های خود را وارد کند.
-
پیش بینی بلادرنگ: مدل با استفاده از داده های وارد شده توسط کاربر، پیش بینی ها را فورا نمایش می دهد.
پیش بینی و پیشنهاد فرمولاسیون
برای پیش بینی و پیشنهاد فرمولاسیون پنیر پیتزا، فرآیند مشابهی با پیش بینی کیفیت محصول طی شد؛ اما در این حالت، ورودی ها و خروجی های مدل ( x و y ) جابجا شدند. این بار، کاربران با ارائه اطلاعات مربوط به وزن محصول مورد نظر و کیفیت دلخواه، داده های x را به مدل می دهند و مدل مقادیر y را که نشان دهنده مواد اولیه و مقادیر مورد نیاز برای تولید محصول است، پیش بینی می کند.
فرآیند مدل سازی
-
تعریف ورودی و خروجی ها:
-
ورودی ها ( x ): وزن محصول ( به عنوان مثال، ۵۰۰ کیلو گرم پنیر پیتزا ) و پارامتر های کیفیت مورد نظر ( مانند امتیاز یا مقدار کشسانی، ذوب پذیری و … ).
-
خروجی ها ( y ): مقادیر مواد اولیه برای دستیابی به کیفیت و وزن مشخص شده.
-
استفاده از مدل Decision tree: در اینجا هم از مدلی که برای پیش بنی کیفیت استفاده شد، برای پیش بینی و پیشنهاد فرمولاسیون تولید نیز اسفاده شد. فرایند نرمال سازی داده ها، تقسیم داده ها به آموزش و آزمون، و بررسی معیار های ارزیابی، دقیقا مانند مراحل قبل انجام شد.
-
نتایج ارزیابی:
-
مقدار MSE: 0.0936
-
Score R2: 0.8983
-
نمودار توزیع نشان داند که داده ها پیش بینی شده مدل و داده های واقعی همپوشانی قابل توجهی دارند که بیانگر دقت مناسب مدل در پیش بینی فرمولاسیون است.
-
-
استقرار مدل:
این مدل نیز با استفاده از کتابخانه Streamlit به وب اپلیکیشن اضافه شد و در محیط شرکت فرنان مستقر گردید. کارکنان شرکت، از جمله تیم های تولید، تضمین کیفیت، و مدیران خط تولید و مدیران کنترل و تضمین کیفیت، اکنون میتوانند به صورت آنلاین و بلادرنگ:
-
داده های وزن و کیفیت مورد نظر خود را وارد کنند.
-
مقادیر مواد اولیه پیشنهادی برای تواید محصول را دریافت کنند.
این مدل در کنار مدل پیش بینی کیفیت، یک سیستم جامع برای مدیریت و بهینه سازی فرآیند تولید پنیر پیتزا فرآهم کرده است که باعث افزایش دقت و بهره وری در تولید محصولات شرکت فرنان می شود.

جمع بندی نهایی
در این مقاله، به بررسی و پیاده سازی یک پروژه جامع هوش مصنوعی برای پیش بینی کیفیت و پیشنهاد فرمولاسیون تولید پنیر پیتزا پرداختیم. این پروژه که توسط تیم هوش مصنوعی شرکت فکور صنعت انجام شد، بهبود قابل توجهی در فرآیند های تولید، دقت پیش بینی ها و کاهش هزینه ها ایجاد کرد.
نکات کلیدی پروژه:
-
-
پیش بینی کیفیت محصولات: مدل Decision tree، با دریافت مقادیر مواد اولیه، پارامتر های کیفیت محصول را پیش بینی می کند.
-
پیش بینی و پیشنهاد فرمولاسیون تولید: مدل با دریافت وزن و کیفیت مورد نظر، مقادیر مواد اولیه را برای تولید ارائه می دهد.
-
ابزار های مدرن و فناوری های پیشرفته: طراحی فرم دیجیتال برای جمع آوری داده ها، استفاده از نرمال سازی برای بهینه سازی داده ها و توسعه یک وب اپلیکیشن اختصاصی با Streamlit، فرایند پیش بینی و بهره برداری از مدل ها را ساده و کارآمد کرد.
-
مزایای کلیدی پروژه:
-
کاهش هزینه های آزمایشگاهی: مدل هوش مصنوعی به دلیل محاسبات الگوریتمی و منطقی بر اساس داده های شرکت فرنان، نیاز به انجام آزمایش های پر هزینه را کاهش می دهد.
-
کاهش خطاهای انسانی: استفاده از فناوری های هوشمند و خودکار، خطاهای ناشی از عوامل انسانی را به حداقل رسانده است.
-
صرفه جویی در مواد اولیه: مدل پیش بینی فرمولاسیون امکان استفاده بهینه از مواد اولیه و کاهش هدررفت را فراهم کرده است.
-
شبیه سازی دنیای واقعی: مدل ها قابلیت شبیه سازی نتایج در دنیای واقعی را دارند. این به معنای امکان:
-
-
ارزیابی کیفیت محصول پیش از تولید: کیفیت محصول پیش از تولید واقعی، بر اساس مقادیر مواد اولیه، پیش بینی می شود.
-
آزمون احتمالات مختلف: شبیه سازی احتمالات گوناگون کیفیت یا فرمولاسیون قبل از آزمون های واقعی.
-
کاهش هزینه های جانبی: به دلیل پیش بینی و شبیه سازی، هزینه های ناشی از آزمون های آزمایشی یا تولیدات ناموفق در دنیای واقعی کاهش می یابد.
-
افزایش بهره وری تولید: امکان پیش بینی دقیق و بلادرنگ کیفیت و فرمولاسیون، باعث شد فرآیند های تولید کارآمدتر شوند.
-
کاهش ضایعات: شبیه سازی ها و پیش بینی های دقیق، از تولید محصولات بی کیفیت جلوگیری می کند.
-
سهولت در تصمیم گیری: وب اپلیکیشن طراحی شده، استفاده از مدل را برای مدیران، کارکنان خط تولید و کنترل و تضمین کیفیت آسان و سریع کرده است.
-
چشم انداز آینده
-
توسعه شبیه سازی های پیچیده تر: افزودن قابلیت هایی برای شبیه سازی کیفیت و فرمولاسیون در مقیاس های بزرگ تر و با متغیر های بیشتر.
-
ادغام با داده های خارجی: بهبود مدل ها با داده های بازار و داده های صنعتی برای پیش بینی دقیق تر.
-
به روزرسانی مداوم مدل: افزایش دقت مدل ها با داده های جدید و روش های یادگیری مستمر.
این پروژه نمونه ای موفق از به کارگیری هوش مصنوعی در صنعت غذایی است که نه تنها دقت و کیفیت تولید را بهبود بخشید، بلکه از طریق کاهش هزینه ها و افزایش کارایی، ارزش افزوده قابل توجهی برای شرکت فرنان ایجاد کرد.


