جستجو برای:
  • صفحه اصلی
  • دوره های آموزشی
  • مجله آنلاین
  • مدرسان
  • مشاوره خصوصی
  • راهنمای تدریس در مدرسه
  • بوت کمپ نوروزی هوش مصنوعی
  • سایر
    • درباره ما
    • همکاری با ما
    • تبلیغات
 
  • T.me/DataSciSchool
  • Instagram.com/DataSciSchool
  • مدرسان
  • تدریس
  • تبلیغات
  • مشاوره خصوصی
مدرسه علم داده
  • خانه
  • دوره ها
  • مجله آنلاین
  • پژوهش های علمی
  • مدرسان
  • راهنمای تدریس
  • قوانین و مقررات
  • درباره ما
  • تماس با ما
  • سایر
    • تبلیغات
    • اخبار
      • در ایران
      • در جهان
    • مشاوره خصوصی
    • فرصت های شغلی
    • همکاری با ما
    • شبکه های اجتماعی
0

ورود و ثبت نام

کارگاه آموزشی پروژه محور طراحی و پیاده سازی انباره داده با آپاچی اسپارک

خانهکارگاه های آموزشی آنلاینآپاچی اسپارککارگاه آموزشی پروژه محور طراحی و پیاده سازی انباره داده با آپاچی اسپارک
حالت مطالعه

فیلم رویداد در انتهای این بخش قرار دارد.

چرا باید در این کارگاه شرکت کنیم؟

Warehouse یا انبار داده مهم‌ترین بخش یک سیستم تحلیل داده به شمار می‌رود. اما طراحی آن نیاز به دانش تجربی و نظری قدرتمندی دارد. همچنین ابزارهای بسیار متنوعی برای واکشی و استخراج داده‌ها از دیتابیس‌های عملیاتی و انتقال آن‌ها به انبار داده وجود دارد. در این کارگاه آموزشی پروژه محور قصد داریم تا با استفاده از Spark چند جدول از درون دیتای یک روز اکشن‌های کاربران استخراج کنیم.

سطح این رویداد در چه حدی می باشد؟

رویداد در سطح پیشرفته برگزار خواهد شد و مناسب افرادی است که با Spark، Parquet, Database Design آشنایی داشته باشند.

سرفصل های اصلی دوره شامل چه مواردی است؟

  • Warehousing. چرا و چگونه؟
  • Parquet و دیگر تکنیک‌های ذخیره‌سازی داده
  • طراحی یک Data Mart کوچک

آیا در پایان رویداد مدرک پایان دوره به شرکت کنندگان اعطا می شود؟

بله، مدرسه علم داده دارای مجوز شرکت خلاق از معاونت علمی و فناوری ریاست جمهوری، دارای مجوز واحد فناور از مرکز رشد پارک علم و فناوری تحت نظارت وزارت علوم تحقیقات و فناوری و دارای مجوز واحد فرهنگی دیجیتال از وزارت فرهنگ و ارشاد اسلامی است است، گواهینامه معتبر پایان دوره برای شرکت کنندگان صادر می گردد.

نمونه گواهینامه رسمی و معتبر مدرسه علم داده

توجه: گواهینامه مدرسه علم داده بدون کداختصاصی قابل استعلام و واترمارک درج شده در ذیل نام و نام خانوادگی، نام دوره و هم چنین امضای مدیریت فاقد اعتبار است.

آشنایی با مدرس رویداد

HJ

حمید جهانی

حمید، فارغ التحصیل ارشد Data Science از دانشگاه تربیت مدرس تهران است. حمید بعنوان Business Data Analyst در Digikala فعالیت داشته است و در حال حاضر Data Scientist در شرکت Snappfood است.

آشنایی با موضوع رویداد

امروزه تقریباً هر سازمانی به طور گسترده از داده‌های کلان برای دستیابی به برتری رقابتی در بازار استفاده می‌کند و خلق راهکارهای جدید و ابزارهای قدرتمند جهت مدیریت داده های بزرگ کمک بسیار شایانی به متخصصین بیگ دیتا و مدیران سازمان ها در تحلیل هرچه بهتر داده ها و تصمیم گیری های درست خواهد کرد.

آپاچی اسپارک یک Engine بسیار قدرتمند، برای پردازش داده‌های بزرگ به صورتِ توزیع‌شده است که قابلیت پردازش داده ها به صورت Parallel  یا موازی روی چندین کامپیوتر به صورت خودکار و همزمان را داراست. مهم ترین نکته در فناوری Spark مدیریت داده ها به صورت Real Time می باشد و همچنین با پردازش داده ها در Ram سرعت پردازش را بالا برده و موجب افزایش قدرت محاسباتی می شود.

موتور Spark با ارائه API برای توسعه دهندگان وظیفه برنامه نویسی را از دوش آنها برداشته و کار آنها را بسیار آسان کرده است و نیازی نیست برای استفاده از سرویس های این سرور به صورت صفر تا صد کدنویسی انجام شود ، فقط کافی است تکنیک های استفاده از API را بلد باشیم.

در یک سازمان نرم‌افزارهای مختلفی قرار دارد که هر کدام داده‌هایی را تولید می‌کنند و در فرآیند هوش تجاری بایستی از آن‌ها جهت ایجاد ارزش استفاده کنیم اگر بخواهیم برای هر پرس و جو (Query) که به تحلیل ما کمک کند، به این نرم‌افزارها درخواستی دهیم، احتمالا وقت و زمان خود را هدر داده‌ایم. پس بهتر است داده‌ها را با توجه به موضوعی که می‌خواهیم تحلیل کنیم در یک مکان انبار کنیم. به این مکان انبار داده (Data Warehouse) می‌گویند.

انبار داده قلب هوش تجاری است. بدون انبار داده، جریان اطلاعات در سیستم های عملیاتی متوقف میشود. در این شرایط کسب و کار فقط نوک بینی خود را میتواند ببیند. داده ها در سیستم های عملیاتی متولد میشوند اما پرورش و بلوغ آن ها در انبار داده و در لایه بعد از آن روی میدهد. بدون انبار داده، یک کسب و کار فقط سیستم مکانیزه دارد نه هوش تجاری، هوش تجاری بدون انبار داده یک شوخی با ریسک بالا است.

Data Mart بر روی یک ناحیه عملکردی واحد از یک سازمان متمرکز است و شامل زیرمجموعه‌ای از داده‌های ذخیره شده در یک Data Warehouse است. Data Mart یک نسخه فشرده از Data Warehouse است و برای استفاده توسط یک بخش، واحد یا مجموعه‌ای از کاربران خاص در یک سازمان طراحی شده است. به‌عنوان‌مثال، بازاریابی، فروش، منابع انسانی یا امور مالی اغلب توسط یک بخش واحد در یک سازمان کنترل می‌شود.

Data Mart معمولاً داده‌ها را از منابع کمتری در مقایسه با انبار داده (Data Warehouse) می‌گیرد. دیتا مارت ها از نظر اندازه کوچک هستند و در مقایسه با Datawarehouse انعطاف‌پذیرتر هستند.

چرا به Data Mart نیاز داریم؟

  • Data Mart به دلیل کاهش حجم داده به افزایش زمان پاسخگویی به کاربر کمک می‌کند.
  • دسترسی آسان به داده‌های درخواستی را فراهم می‌کند.
  • پیاده‌سازی Data mart در مقایسه با Datawarehouse ساده‌تر است. درعین‌حال، هزینه اجرای Data Mart در مقایسه با اجرای یک انبار داده کمتر است.
  • در مقایسه با Data Warehouse، دیتامارت سریع‌تر است. در صورت تغییر در مدل، دیتامارت به دلیل اندازه کوچک‌تر می‌تواند سریع‌تر ساخته شود.
  • Datamart توسط یک کارشناس موضوعی واحد تعریف می‌شود. برعکس، انبار داده توسط SMEهای میان‌رشته‌ای از حوزه‌های مختلف تعریف می‌شود. ازاین‌رو، Data mart در مقایسه با Datawarehouse در قابل تغییر است.
  • داده‌ها پارتیشن‌بندی شده‌اند و اجازه دسترسی بسیار جزئی را می‌دهند.
  • داده‌ها را می‌توان بر روی پلتفرم‌های سخت‌افزاری و نرم‌افزاری مختلف تقسیم‌بندی و ذخیره کرد.

فرمت فایل Parquet

  • این فرمت فایل توسط کلودرا و توییتر در سال ۲۰۱۳ ایجاد شد.
  • از ویژگی های منحصر به فرد Parquet این است که می تواند داده ها را با ساختارهای تو در تو به صورت ستونی ذخیره کند. با این وجود فیلدهای تودرتو را می توان به صورت جداگانه و بدون خواندن تمام فیلدهای ساختار تودرتو خواند.
  • این فرمت برای کار با حجم عظیمی از داده های پیچیده مناسب است و گزینه های فشرده سازی و رمزگذاری(Encoding) داده های مختلفی را ارائه می دهد.
  • این فرمت فایل برای خواندن ستون‌های خاص از جداول بزرگ بسیار مفید است، زیرا تنها می‌تواند ستون‌های مورد نیاز را به جای کل جدول بخواند. این امر منجر به پردازش سریع‌تر داده‌ها می‌شود و زمان مراجعه به I/O را کاهش می دهد.
  • قابلیت ذخیره سازی ستونی موجب می­ شود، داده های غیر مرتبط را به سرعت در حین پرس و جو فیلتر کند.
  • کدک‌های مختلفی برای فشرده‌سازی داده‌ها وجود دارد و فایل‌های داده می‌توانند انواع فشرده‌سازی متفاوتی داشته باشند.
مشاهده فیلم ضبط شده رویداد

مشاهده فیلم ضبط شده رویداد ویدئو

58:43

خصوصی
این بخش خصوصی می باشد. برای دسترسی کامل به دروس این دوره باید این دوره را خریداری نمایید.
برچسب: اسپارک انباره داده بیگ دیتا دوره اسپارک دوره انباره داده کلان داده

دوره های مرتبط

دوره آموزشی تحلیل شبکه های اجتماعی و پیچیده با پایتون

فیلم های دوره در انتهای این بخش قابل مشاهده می باشند. چرا باید در این دوره شرکت کنیم؟علم شبکه بر…

کارگاه آموزشی آمار و احتمالات ضروری برای علم داده

فیلم های ضبط شده رویداد در انتهای این بخش قرار دارند. چرا باید در این کارگاه شرکت کنیم؟این کارگاه بعنوان…

کارگاه آموزشی پروژه محور مبانی یادگیری عمیق با پایتون

چرا باید در این کارگاه شرکت کنیم؟یادگیری عمیق امروزه یکی از پرکابردترین ابزارها در حوزه های مختلف علم و تکنولوژی…

مینی دوره آموزشی بینایی ماشین و یادگیری عمیق

چرا باید این دوره را تهیه کنم؟این وبینار به منظور آشنایی با مباحث بینایی ماشین در الگوریتم های یادگیری عمیق…

کارگاه آموزشی مهندسی داده

چرا باید در این کارگاه شرکت کنیم؟مهندسی داده به عنوان یک جایگاه شغلی نوظهور در حوزه پردازش داده، نقش مهمی…

کارگاه آموزشی پروژه محور برنامه نویسی پایتون پیشرفته

چرا باید در این کارگاه شرکت کنیم؟ توانایی فهم بیشتر از کدهای موجود در گیت هاب توانایی کد زدن اصولی…

کارگاه آموزشی پروژه محور اصول پردازش زبان طبیعی در پایتون

فیلم رویداد در انتهای این بخش قرار گرفته است. چرا باید در این کارگاه شرکت کنیم؟در این کارگاه آموزشی پروژه…

کارگاه آموزشی متدلوژی توسعه پروژه های تحلیل داده

فیلم رویداد ضبط شده و در انتهای این بخش موجود است. چرا باید در این کارگاه شرکت کنیم؟ فرض کنیم…

دوره جامع پروژه محور یادگیری عمیق با پای تورچ (PyTorch)

Deep Learning with PyTorch Framework

پلتفرم بعنوان سرویس با Docker برای مهندسان داده

آشنایی با Docker  Docker یک ابزار برای ایجاد کانتینر است که به توسعه‌ی استاندارد نرم افزار کمک می‌کند. با استفاده…

امتیاز دانشجویان دوره

0
بدون امتیاز 0 رای
300,000 تومان 199,000 تومان
0 رأی
5 ستاره
0
4 ستاره
0
3 ستاره
0
2 ستاره
0
1 ستاره
0

نظرات

تنها اشخاصی که این محصول را خریداری کرده اند و وارد سایت شده اند می توانند در مورد این محصول بازبینی ارسال کنند.

قیمت :

300,000 تومان 199,000 تومان

امتیاز
0 از 0 رأی
بدون امتیاز 0 رای
300,000 تومان 199,000 تومان
نوع دوره: غیر حضوری
سطح دوره: متوسط
پیش نیاز: آشنایی با مهندسی داده
زبان: فارسی
گواهی نامه رسمی مدرسه علم داده
محور اصلی : Big Data
ابزار اصلی : Apache Spark
درصد پیشرفت دوره: %100
3.11k بازدید 0 دیدگاه
حمید جهانی
حمید جهانی
دانشمند علم داده

حمید، فارغ التحصیل ارشد Data Science از دانشگاه تربیت مدرس تهران است. حمید بعنوان Business Data Analyst در Digikala فعالیت داشته است و در حال حاضر بعنوان Data Scientist در شرکت Snappfood مشغول به کار است.

دسته: آپاچی اسپارک، کارگاه های آموزشی آنلاین

داستان Data Science School

مدرسه علم داده با توجه به نفوذ روزافزون هوش مصنوعی در دنیا، با هدف آماده سازی نسل جوان به منظور ورود به بازار کار ناب هوش مصنوعی تاسیس شد. پس از درخشش در صنعت آموزش آنلاین از سوی معاونت علمی، فناوری و اقتصاد دانش بنیان ریاست جمهوری ایران به عنوان شرکت خلاق برگزیده شدیم. برنامه اصلی مدرسه علم داده در سه شاخه آموزش، پژوهش و پیاده سازی پروژه های پیشرفته هوش مصنوعی استوار است.

منوهای کاربردی
  • صفحه اصلی
  • مجله آنلاین
  • دوره های پروژه محور
  • حساب کاربری
  • راهنمای تدریس
  • منتور شوید
  • مشاوره
  • تبلیغات
  • مدرسان
  • همکاری با ما
  • درباره ما
  • تماس با ما
  • بوت کمپ نوروزی هوش مصنوعی 1402
اعتماد شما، سرمایه معنوی ماست :-)
© 2025 مدرسه علم داده. تمامی حقوق محفوظ است

ورود

رمز عبور را فراموش کرده اید؟

هنوز عضو نشده اید؟ عضویت در سایت