Результаты (
русский) 2:
[копия]Скопировано!
Существует в настоящее время значительный энтузиазм вокруг MapReduce
(MR) парадигмы для анализа данных масштабного [17]. Хотя
основной поток управления этой структуры существует в параллельных
SQL-систем управления базами данных (СУБД) для более чем 20 лет, некоторые
называют г-на принципиально новых вычислительных модель [8, 17]. В
этой статье мы опишем, и сравнить обе парадигмы. Кроме того,
мы оцениваем оба вида систем в плане производительности и развития
сложности. Для этого, мы определяем точку отсчета, состоящую
из коллекции задач, которые мы уже запустили на открытом исходном
варианте МР, а также на двух параллельных СУБД. Для каждой задачи,
мы измеряем производительность каждой системы для различных степеней параллелизма
в кластере 100 узлов. Наши результаты показывают некоторые интересные
компромиссы. Хотя процесс загрузки данных в и настроить
выполнение параллельных СУБД взял намного дольше, чем МР
системе, наблюдается исполнение этих СУБД была поразительно
лучше. Мы полагаем, о причинах резкого производительности
разницы и рассмотреть концепции реализации, что будущие системы
должны принимать от обоих видов архитектур.
переводится, пожалуйста, подождите..