Hadoop یک چارچوب نرم‌افزاری رایگان، منبع باز و مبتنی بر جاوا است که برای ذخیره‌سازی و پردازش مجموعه‌ای بزرگ از داده‌ها برروی چندین دستگاه (خوشه هایی از سرورها) استفاده می‌شود. این برنامه، از HDFS ( سیستم فایل توزیع شده Hadoop) برای ذخیره داده‌های خود و پردازش این داده‌ها با استفاده از MapReduce استفاده می‌کند. این نرم افزار، یک اکوسیستم از ابزارهای Big Data است که توسط کمپانی Apache ساخته شده است و  در درجه اول برای داده کاوی و یادگیری ماشین مورد استفاده قرار می‌گیرد. Hadoop معمولاً پردازش ها را به صورت توزیع شده (بر روی چند کامپیوتر مختلف) انجام داده و نتایج را به کامپیوتر مقصد برمی‌گرداند. 

ادامه‌ی مطلب