معرفی AWS #
شرکت خدمات وب آمازون یا AWS یکی از شرکتهای تابعه آمازون است که پلتفرمهای محاسبات ابری و APIهای درخواستی را به افراد، شرکتها و دولتها برمبنای پرداخت هزینه به میزان استفاده، ارائه میدهد و آنچه به عنوان AWS می شناسیم، یک پلتفرم ابری جامع و در حال توسعه است که توسط این شرکت ارائه شده است. AWS ترکیبی از زیرساخت به عنوان یک سرویس (IaaS)، پلتفرم به عنوان یک سرویس (PaaS) و نرم افزار به عنوان یک سرویس (SaaS) است.
AWS طیف وسیعی از سرویسها را برای افراد و همچنین سازمانهای بخش دولتی و خصوصی برای ایجاد برنامههای کاربردی از هر نوع ارائه میکند، این خدمات یا سرویسها ابری و مقرون به صرفه هستند. همچنین با بسیاری از زبان های برنامه نویسی تعامل دارند، از طریق شبکه های مختلف و با سایر ارائه دهندگان خدمات ابری رقیب (CSP ها) ارتباط برقرار می کنند.
آنچه که به علم داده مربوط است، خدمات زیادی است که در حوزه یادگیری ماشین ارائه می دهد. شما هم می توانید از بخش services، از دسته Machine Learning، از مدلهای آماده استفاده کنید و هم می توانید با انتخاب پلتفورم دلخواه از میان تعداد زیاد پلتفورمهایی که در اختیار می دهد مانند python3 conda مدل خودتان را بسازید.
خدمات آماده AWS در حوزه علم داده ها #
شما می توانید از خدمات (سرویسها) آماده AWS برای کاربردهای مختلف د رحوزه علوم داده استفاده کنید:
AWS در ادامه به معرفی برخی از این سرویسها می پردازیم:
- Image Rekognition: یک سرویس تشخیص تصویر است که اشیا، صحنه ها، فعالیت ها، نشانه ها، چهره ها، رنگ های غالب و کیفیت تصویر را تشخیص می دهد.Image Rekognition همچنین متن را استخراج می کند، افراد مشهور را تشخیص می دهد و محتوای نامناسب در تصاویر را شناسایی می کند.
- Amazon Polly: یک سرویس ابری است که متن را به گفتار واقعی تبدیل می کند همچنین از چندین زبان پشتیبانی کرده و شامل انواع صداهای واقعی است.
- Amazon Sagemaker:شما با SageMaker می توانید آموزش و استقرار مدل های یادگیری ماشینی را در سطوح مختلف انتزاع انجام دهید. در بالاترین سطح ، SageMaker مدل های یادگیری ماشین از پیش آموزش دیده ای را ارائه می دهد که می توانید همانطور که هستند آنها را استقرار دهید و از آنها استفاده کنید. شما می توانید برخی از الگوریتمهای یادگیری ماشینی که به شما ارائه می دهد را بر اساس دادههای خود آموزش دهید. همچنین می توانید مدل خود را از ابتدا ایجاد کنید. همچنین، رابطهای (interfaces) مختلفی را در اختیار توسعه دهندگان قرار می دهد.
- Amazon Textract:یک سرویس یادگیری ماشینی (ML) است که به طور خودکار متن، دست خط و داده ها را از اسناد اسکن شده استخراج می کند. برای شناسایی، درک و استخراج داده ها از فرم ها و جداول، فراتر از تشخیص ساده کاراکتر نوری (OCR) عمل می کند.
- Amazon Deelens: یک برنامه بینایی کامپیوتری مبتنی بر یادگیری عمیق است.
- Amazon Comprehend:از پردازش زبان طبیعی (NLP) برای استخراج بینش در مورد محتوای اسناد استفاده می کند و این کار را با شناسایی موجودیت ها، عبارات کلیدی، زبان، احساسات و سایر عناصر مشترک در یک سند، انجام می دهد.
- Amazon Lex:برای ایجاد رابط های محاوره ای با استفاده از صدا و متن در هر کاربرد است. برای تبدیل گفتار به متن شامل کارکردهای یادگیری عمیق تشخیص خودکار گفتار (ASR) و برای تشخیص هدف و منظور متن، شامل کارکردهای یادگیری عمیق درک زبان طبیعی (NLU) است.
ایجاد مدل یادگیری ماشین دلخواه در AWS #
برای ایجاد یک مدل دلخواه یادگیری ماشین در AWS می توانید از سرویس Sagemaker استفاده کنید. برای اینکار باید مراحل زیر را طی کنید:
- – از داشبورد Sagemaker گزینه ایجاد Notebook instance را انتخاب کنید.
- – در تنظیمات Notebook instance نامی برای instance خود انتخاب کنید. همچنین نوع یا سایز مدل خود را انتخاب می کنید.
- – مرحله بعدی شناختن دیتاست به مدل است. برای اینکار باید یک IAM Role ایجاد کنید. IAM Role یک نقش جدید برای اکانت AWS شما ایجاد می کند که مجوزهای خاصی دارد. به عنوان مثال، گزینه any S3 bucket یعنی در آینده هم هر باکتی ایجاد شد، اجازه دسترسی دارد.
- – برای ذخیره داده های خود در آمازون S3 (Amazon Simple Storage Service)، ابتدا یک bucket ایجاد می کنید و نام bucket و AWS region را مشخص می کنید. سپس، داده های خود را به عنوان اشیاء یا objects در آمازون S3 و در آن bucket آپلود می کنید. هر شی یا object دارای یک کلید (یا نام کلید) است که شناسه منحصر به فرد شیء درون bucket است.
- – پس از طی مراحل بالا، instance موردنظر شما به حالت Pending در می آید و مدتی طول می کشد تا آماده به کار (In service) شود.
- – پس از آن می توانید Jupyter را باز کرده و محیط توسعه خود (مثلا Conda-Python3) را انتخاب و کد مدل خود را وارد کنید.
- – توجه کنید که در هر محیطی کار کنید باید از instanceی که ایجاد کردید، دیتا را لود کنید و مثلا در پایتون آن را در یک dataframe بریزید. بنابراین به کتابخانه های مرتبط نیاز دارید. درپایتون کتابخانه sagemaker وجود دارد که می توانید از متدهای آن برای اینکار استفاده کنید.
- در انتهای کار هم پاک کردن باکت را فراموش نکنید زیرا AWS شما را به اندازه استفاده شارژ می کند.