دوره در چه سطحی می باشد؟
این دوره آموزشی مناسب افرادی است که آشنایی مقدماتی با زبان برنامه نویسی پایتون داشته باشند.
سرفصل های اصلی دوره کدامند؟
آشنایی با مفاهیم پایه ای دوره
- بررسی پیش نیازها
- كاربردهاي پردازش زبان طبيعي
- معرفی Stemmer
- معرفی Lemmatizer
- معرفی NER
- Stop word چیست؟
- منظور از stemming و lemmatization چيست و چه تفاوتي دارند؟
- منظور از POS چيست؟
کار با کتابخانه های NumPy و Pandas
- آموزش کار با Jupyter Notebook
- آموزش کار با Google Coolab
- آموزش کار با کتابخانه Pandas
- آموزش کار با کتابخانه Numpy
- آموزش کار با کتابخانه Sklearn
- آموزش کار با کتابخانه Tensorflow
- آموزش کار با کتابخانه Keras
- آموزش کار با کتابخانه Genism
- آموزش کار با کتابخانه FastText
نصب و کار با کتابخانه های پیش پردازش متون فارسی
- معرفی و نصب کتابخانه Hazm
- معرفی و نصب کتابخانه Parsivar
- معرفی و نصب کتابخانه ابزار Nltk
فاز Feature Selection در NLP
- معرفی معیارهای Term Frequency , Inverse Document Frequency
- تبدیل متن به Vector
مفهوم Word Embedding یا تعبیه سازی کلمات
- Word Embbeding چیست؟
- بررسی مزایای استفاده از تعبیه سازی کلمات
- بررسی کاربردهای تعبیه سازی کلمات
- معرفی انواع تعبیه سازی کلمات
- Word2Vec چطور کار می کند؟
- كتابخانههاي برتر براي پردازش زبان طبيعي در پايتون كداماند؟
این دوره آموزشی مناسب چه کسانی است؟
این دوره آموزشی مناسب افرادی است که قصد دارند درک بهتری ار پردازش زبان طبیعی با استفاده از روش های یادگیری عمیق داشته باشند.
آیا پس از اتمام دوره گواهی معتبر برای مخاطبین صادر می گردد؟
پس از قبولی در آزمون پایانی بله، مدرسه علم داده دارای مجوز شرکت خلاق از معاونت علمی و فناوری ریاست جمهوری، دارای مجوز واحد فناور از مرکز رشد پارک علم و فناوری تحت نظارت وزارت علوم تحقیقات و فناوری و دارای مجوز واحد فرهنگی دیجیتال از وزارت فرهنگ و ارشاد اسلامی است است، گواهینامه معتبر پایان دوره برای شرکت کنندگان صادر می گردد.
نمونه مدرک پایان دوره
توجه: گواهینامه مدرسه علم داده بدون کداختصاصی قابل استعلام و واترمارک درج شده در ذیل نام و نام خانوادگی، نام دوره و هم چنین امضای مدیریت فاقد اعتبار است.
مقدمه
پردازش زبان طبیعی یکی از شاخه های جذاب در حوزه هوش مصنوعی می باشد. هدف اصلی فیلد تحلیل زبانهای طبیعی مانند انگلیسی، فارسی، ترکی و … به منظور آسانتر ساختن فهم آنها برای کامپیوتر می باشد. مسلما درصورتی که کامپیوتر بتواند توسط زبانهای طبیعی با انسان ارتباط برقرار کند، بسیاری از مشکلات تعامل انسان با کامپیوتر حل شده و زندگی برای انسانها راحت تر خواهد شد.
در دنیای امروز با بهکارگیری پرشتاب تکنولوژی ارتباطات و اطلاعات که انبوهی از اطلاعات در قالب متون الکترونیکی تولید میشود، کسب و کارها میتوانند از طریق پردازش زبان طبیعی به اطلاعات با ارزشی در خصوص بازار، مشتریان، رقبا، عملکرد و تصویر کسب و کار خود در نظر مشتریان و کسب و کارهای دیگر دست یابند. کسب و کارها از طریق تحلیل احساسات و به عبارتی تحلیل نظرات مثبت، منفی یا بی تفاوت کاربران نسبت به متن های موجود، میتوانند به اطلاعات ارزشمندی برای بهبود و توسعه کسب و کار خود دست یابند. داده کاوی و پردازش زبان طبیعی به ویژه در پروژه های تحقیقاتی و پروژه های پژوهشی نیز کاربرد بسیار زیادی دارد.
در این میان، زبان برنامه نویسی پایتون یکی از ابزار بسیار کامل و کاربردی در انجام پروژه های پردازش زبان طبیعی است.
زبان برنامه نویسی پرطرفدار و پرکاربرد پایتونبا داشتن قابلیتهایی همچون متن باز بودن، کاربرد در توسعه پلتفرم های بیگ دیتا ، ماژول ها و کتابخانه های استاندارد و توسعه یافته، و قابلیت استفاده از کتابخانهها و کدهای ایجاد شده در سایر زبانهای برنامه نویسی ، از جمله ابزاری است که مورد اکثریت برنامه نویسان و متخصصین حوزه علوم داده قرار گرفته است.
هدف
هدف از دوره پردازش زبان طبیعی با استفاده از یادگیری عمیق ، آموزش نحوه اجرای پروژه های پایه ای پردازش متن و تحلیل احساسات بر اساس زبان برنامه نویسی پایتون به صورت کاربردی میباشد.
مخاطبین دوره
- دانشجویان مهندسی کامپیوتر، فناوری اطلاعات و علوم کامپیوتر
- برنامه نویسان و علاقه مندان به راه کارهای داده کاوی و متن کاوی
- محققان، پژوهشگران و کارشناسان تحلیل داده در حوزهی داده کاوی و متن کاوی و تحلیل احساسات
- علاقمندانی که زمینه قبلی برنامه نویسی با پایتون دارند و حال میخواهند با بهکارگیری تکنیک های آمار ، یادگیری ماشین ، مصورسازی داده ها ، تحلیل شبکه های اجتماعی ، و تحلیل متن ، پروژه های متن کاوی خود را اجرا کرده و به بینش جدیدی نسبت به داده ها دست یابند.
در دوره پردازش زبان طبیعی با یادگیری عمیق، چه ابزارهایی را استفاده می کنیم؟
زبان برنامه نویسی پایتون
کتابخانه Pandas
کتابخانه NumPy
کتابخانه TensorFlow
کتابخانه Keras
کتابخانه Scikit-learn
کتابخانه FastText
آشنایی با مدرس دوره
محمد حیدری
بنیانگذار مدرسه علم داده
مهندس کلان داده، ژرف اندیشان رایانش هوشمند شریف
ارشد مهندسی فناوری اطلاعات، دانشگاه تربیت مدرس تهران
پژوهشگر ارشد هوش مصنوعی، پژوهشگاه دانش های بنیادی (IPM)
مقالات
- Heydari and M. Soltanshahi, “MLOps, Tools, Challenges, and Solutions”, Submitted to 7th IEEE IAEA, 2023, [Ref]
- Heydari and M. Soltanshahi, “The Role of AI and Big Data Analytics in Cyber Security”, Submitted to 2nd CYSP, 2023
- Bayat, M. Heydari, A. Albadvi “Analysis of Insect-Plant Interactions, A Graph Mining Approach.”, arXiv, 2023 [Re]
- Heydari and B. Teimourpour, “Persian News on Instagram, A Words Co-occurrence Graph-based Approach.” Submitted to ICCKE2023
- Heydari and B. Teimourpour, “Graph Representation Learning Towards Patents Network.” 11th IEEE ICCKE, 2021 [Ref]
- Heydari, M. Khazeni and M. Soltanshahi, “Deep Learning Sentiment Analysis in Persian Language,” 7th IEEE ICWR, 2021 [Ref]
- Heydari and B. Teimourpour, “Persian Opinion Mining: A Networked Analysis Approach.” 7th IEEE ICWR, 2021 [Ref]
- Heydari and B. Teimourpour, “Analysis of ResearchGate, a Community Detection Approach.” 6th IEEE ICWR, 2020 [Ref]
- Heydari, “Sentiment Analysis Challenges in Persian Language.”, arXiv, 2019 [Ref]
سوابق برگزاری کارگاه های آموزشی در سطح ملی
- پنجمین سمینار زمستانه علوم کامپیوتر، دانشگاه صنعتی شریف، تهران، زمستان 1397
- پردازش و تحلیل گراف با استفاده از Python و NetworkX
- ششمین سمینار زمستانه علوم کامپیوتر، دانشگاه صنعتی شریف، تهران، زمستان 1398
- پردازش و تحلیل کلان داده ها با Apache Spark
- یازدهمین کنفرانس بین المللی فناوری اطلاعات، دانشگاه شهید بهشتی تهران، پاییز 1399
- مهندسی کلان داده ها با استفاده از Hadoop Ecosystem
- دومین رویداد تابستانه هوش مصنوعی، دانشگاه صنعتی امیرکبیر، بهار 1400
- پردازش زبان طبیعی با استفاده از هوش مصنوعی و یادگیری عمیق
- دوازدهمین جشنواره ملی لینوکس، دانشگاه صنعتی امیرکبیر، تابستان 1400
- ابزارهای کلیدی برای پردازش و تحلیل کلان داده ها
سوابق تدریس
- هنرآموز بیش از 2000 علاقه مند به علوم داده و کلان داده، مدرسه علم داده
- از دی 1398 تا به امروز
- تدریس یار درس کاوش مه داده، دانشکده علوم ریاضی و کامپیوتر، دانشگاه تربیت مدرس تهران
- بهار 1400
- تدریس یار درس کاوش دادگان انبوه، دانشکده مهندسی صنایع و سیستم ها، دانشگاه تربیت مدرس تهران
- زمستان 1398
- تدریس یار درس داده کاوی و کشف دانش، دانشکده مهندسی صنایع و سیستم ها، دانشگاه تربیت مدرس تهران
- زمستان 1398
- تدریس یار درس شبکه های پیچیده، دانشکده مهندسی صنایع، دانشگاه شهید بهشتی تهران
- زمستان 1398
- تدریس یار درس تحلیل شبکه های اطلاعاتی، دانشکده مهندسی صنایع و سیستم ها، دانشگاه تربیت مدرس تهران
- پاییز 1398
- مدرس دوره های برنامه نویسی پایتون و لینوکس، مرکز آموزش های تخصصی جهاد دانشگاهی
- تابستان 1396
دانلود درسنامه های دوره پردازش زبان طبیعی با یادگیری عمیق
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت اول ویدئو
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت دوم ویدئو
8:12
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت سوم ویدئو
3:36
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت چهارم ویدئو
9:45
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت پنجم ویدئو
3:00
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت ششم ویدئو
3:52
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت هفتم ویدئو
11:41
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت هشتم ویدئو
10:29
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت نهم ویدئو
12:15
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت دهم ویدئو
11:10
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت یازدهم ویدئو
47:30
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت دوازدهم ویدئو
37:12
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت سیزدهم ویدئو
46:25
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت چهاردهم ویدئو
28:22
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت پانزدهم ویدئو
15:12
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت شانزدهم ویدئو
25:54
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت هفدهم ویدئو
30:17
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت هجدهم ویدئو
5:13
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت نوزدهم ویدئو
34:22
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت بیستم ویدئو
29:36
دوره آموزشی پردازش زبان طبیعی با یادگیری عمیق، قسمت بیست و یکم ویدئو
14:29
دانلود اسلاید دوره
دانلود اسلاید دوره فایل های ضمیمه
ppsx.
پروژه FastText
پروژه FastText فایل های ضمیمه
ipynb.
متاسفانه فایل دیتاست ها و قطعه کدهای دوره از روی سرور پاک شده اند و علی رغم تلاش های بسیار، قابل بازیابی نبودند.
دوره های مرتبط
دوره آموزشی تحلیل شبکه های اجتماعی و پیچیده با پایتون
دوره آموزشی پروژه محور مبانی پردازش تصویر و بینایی ماشین با OpenCV
دوره جامع پروژه محور یادگیری عمیق با پای تورچ (PyTorch)
Deep Learning with PyTorch Framework
دوره آموزشی طراحی و پیاده سازی سیستم های توصیه گر با پایتون
بصری سازی پیشرفته تصاویر پزشکی بر بستر Google Colab
دوره آموزشی ماشین مجازی Cloudera برای تحلیل کلان داده
امتیاز دانشجویان دوره
300,000 تومان 149,000 تومان
محمد حیدری
بنیانگذار مدرسه علم دادهمهندس ارشد کلان داده در سداد، پژوهشگر ارشد هوش مصنوعی در پژوهشگاه دانش های بنیادی، کارشناسی مهندسی نرم افزار از دانشکده فنی تهران، دانشجوی اسبق مهندسی فناوری اطلاعات در دانشگاه شهید بهشتی تهران، فارغ التحصیل کارشناسی ارشد مهندسی فناوری اطلاعات، دانشگاه تربیت مدرس تهران