it-swarm.dev

hadoop

POC для Hadoop в режиме реального времени

Как данные делятся в Hadoop

карта hadoop уменьшает вторичную сортировку

Ошибка Java Hadoop: исключение в потоке "main" Java.lang.NoClassDefFoundError: WordCount (неправильное имя: org/myorg/WordCount)

Как решить, когда использовать Map-Side Join или Reduce-Side при написании кода MR в Java?

Hive FAILED: ParseException строка 2: 0 не может распознать ввод рядом с '' macaddress '' 'CHAR' '(' в спецификации столбца

Есть ли .NET-эквивалент Apache Hadoop?

Как работает алгоритм сортировки MapReduce?

Java vs Python в Hadoop

Запись данных в Hadoop

Масштабируемое хранилище изображений

Где HDFS хранит файлы локально по умолчанию?

Связывание нескольких заданий MapReduce в Hadoop

Как Hadoop выполняет разбиение ввода?

Куда инфраструктура hadoop mapreduce отправляет мои операторы System.out.print ()? (Стандартный вывод)

Twitter (социальные сети) Dataset

Разница между Свинья и Улей? Почему оба?

Почему возникает проблема несовместимых имен пространства имен Hadoop?

Pig Latin: загрузка нескольких файлов из диапазона дат (часть структуры каталогов)

Как я могу использовать тип данных карты в Apache Pig?

Ошибка потокового задания Hadoop в python

Hadoop скопировать каталог?

Где Hive хранит файлы в HDFS?

Ошибка HDFS: может быть реплицирована только на 0 узлов, а не на 1

Как преобразовать файл .txt в формат файла последовательности Hadoop

Перемещение файлов в Hadoop с использованием API Java?

Сжатые файлы Hadoop gzip

объединить выходные файлы после фазы сокращения

Достаточно Java для Hadoop

Как получить имена текущих запущенных заданий hadoop?

Повторять дважды по значениям (MapReduce)

Поиск/Найти файл и содержимое файла в Hadoop

Как отследить, какой блок данных находится в каком узле данных в hadoop?

Способ проверить размер каталога HDFS?

Что подразумевается под разреженными данными / хранилищем данных / базой данных?

Установка количества задач карты и сокращение задач

Как использовать Hadoop для веб-приложения?

Hadoop на OSX "Невозможно загрузить информацию о области из SCDynamicStore"

Hadoop: сжать файл в HDFS?

Масштабная обработка данных Hbase vs Cassandra

Проблема с разрешением Hadoop DFS при запуске задания

Hive: добавление динамического раздела во внешнюю таблицу

LeaseExpiredException: нет ошибки аренды на HDFS

Коэффициент репликации HDFS

как написать подзапрос и использовать предложение "In" в Hive

Как перезаписать/повторно использовать существующий выходной путь для заданий Hadoop снова и снова

Клиент Hbase не может подключиться к удаленному серверу Hbase

Разница между hadoop fs -put и hadoop fs -copyFromLocal

Наменоде не заводится

Должен ли Hive быть установлен в кластере hadoop на всех узлах?

ошибка нехватки памяти в Hadoop

Класс Hadoop JobConf устарел, нужен обновленный пример

Hadoop: "ОШИБКА: Java_HOME не установлен"

Hadoop Datanodes не может найти NameNode

Как указать разделитель KeyValueTextInputFormat в Hadoop-.20 API?

Как использовать Sqoop в программе Java?

выберите различное число используя латинскую свинью

$ HADOOP_HOME устарела

Как написать "только карты" заданий Hadoop?

Самый простой способ в Gradle получить путь к файлу jar в кэше зависимостей gradle

Изменить размер файла в Hadoop

У Hive есть что-то эквивалентное DUAL?

Вызов задания mapreduce из простой Java-программы

Свинья, как посчитать количество строк в псевдониме

Как отлаживать задания Hadoop MapReduce из Eclipse?

Выходной формат JSON для результатов Hive Query

Ошибка запуска Hadoop Job Tracker

Узлы данных не запущены

В чем разница между Apache Pig и Apache Hive?

Ошибка репликации данных в Hadoop

Hadoop Java.io.IOException: Mkdirs не удалось создать/some/path

Различия между Amazon S3 и S3n в Hadoop

hbase не может найти существующую таблицу

методы настройки и очистки Mapper/Reducer в Hadoop MapReduce

невозможно проверить узлы на hadoop [Соединение отказано]

Создание Hadoop с Eclipse/Maven - Отсутствует артефакт jdk.tools:jdk.tools:jar:1.6

Что такое Hive: код возврата 2 из org.Apache.hadoop.Hive.ql.exec.MapRedTask

Как узнать версии Hive и Hadoop из командной строки?

Как вывести список всех файлов в каталоге и его подкаталогах в hadoop hdfs

Как импортировать Java-зависимости org.Apache без Maven

Hbase быстро посчитать количество строк

Разница между Hadoop Map Reduce и Google Map Reduce

Нет такого исключения метода Hadoop <init>

как убить рабочие места Hadoop

Как найти размер файла HDFS

Когда в Hadoop начинается сокращение задач?

Grep для нескольких файлов в файловой системе Hadoop

как выбрать данные из Hive с конкретным разделом?

Hadoop: невозможно использовать команду Jps

Преимущества файла Sequence над hdfs textfile

Объединение двух наборов данных в Mapreduce / Hadoop

Процесс Datanode не работает в Hadoop

Как практиковать программирование Hadoop?

Улей: разбор JSON

копирование каталога из локальной системы в код hdfs Java

Проблемы Hadoop HADOOP_CLASSPATH

Есть ли способ добавить узлы в работающий кластер Hadoop?

Фильтрация нулевых значений с помощью pig

Потребление памяти у naadode hadoop?

получение нулевых значений при загрузке данных из плоских файлов в таблицы Hive