Релиз системы для организации распределенных warehouse-хранилищ Apache Hive 0.6.0

10 ноября 2010 года

Представлен релиз проекта Apache Hive 0.6.0, в рамках которого разработана система для создания хранилищ, оптимизированных для выполнения аналитических запросов над большими массивами данных (Data Warehouse). В качестве основы Apache Hive использует платформу Apache Hadoop, предназначенную для организации распределенной обработки больших объемов данных (петабайты) с использованием парадигмы map/reduce, при которой задача делится на множество более мелких обособленных фрагментов, каждый из которых может быть запущен на отдельном узле кластера.

Кроме традиционной схемы формирования запросов в стиле map/reduce, Apache Hive предоставляет упрощенный механизм обработки данных через SQL-подобный язык запросов HiveQL. Инструкцию по быстрому развертыванию хранилища на базе Apache Hive можно прочитать здесь.

Источники править


 
 
Creative Commons
Эта статья содержит материалы из статьи «Релиз системы для организации распределенных warehouse-хранилищ Apache Hive 0.6.0», опубликованной OpenNET и распространяющейся на условиях лицензии Creative Commons Attribution (CC BY) — указание автора, источник и лицензию.
 
Эта статья загружена автоматически ботом NewsBots в архив и ещё не проверялась редакторами Викиновостей.
Любой участник может оформить статью: добавить иллюстрации, викифицировать, заполнить шаблоны и добавить категории.
Любой редактор может снять этот шаблон после оформления и проверки.

Комментарии

Викиновости и Wikimedia Foundation не несут ответственности за любые материалы и точки зрения, находящиеся на странице и в разделе комментариев.