Быстрый старт
Развертывание
Моделирование данных
Подключение
Запись данных
Миграция
Запросы
Операции и обслуживание
Типовое обслуживание
Секционирование
Резервное копирование и восстановление
Масштабирование
Зеркалирование
Управление ресурсами
Безопасность
Мониторинг
Настройка производительности
Устранение неполадок
Справочник
Руководство по инструментам
Типы данных
Хранилище данных
Выполняющая система
Потоковая передача
Восстановление после сбоев
Конфигурация
Индексы
Расширения
Справочник по SQL
Часто задаваемые вопросы
В этом документе приведены часто задаваемые вопросы, связанные с PXF.
remote component error, Failed connect to localhost:5888; Connection refused (libchurl.c:950)После развертывания PXF при попытке доступа к HDFS возникает ошибка:
remote component error,Failed connect to localhost:5888; Connection refused (libchurl.c:950)
Решение
Способ доступа PXF к файлам требует, чтобы сервер PXF был включен на узле Master, однако файл данных должен находиться на сегменте PXF.
pxf/servers/core-site.xml and hdfs-site.xml должен совпадать с файлом конфигурации Hadoop.
pxf/servers/core-site.xml настраивает права доступа пользователя.
Имя пользователя и группа файла на Hadoop должны совпадать с указанным pxf/core-site.xml.
Решение
Добавьте escape 'off' в параметры.
Используйте format 'text:multi'.
Да.
Предварительные условия
PXF может нормально обращаться к S3.
Решение
Скопируйте файл aa.csv, переименуйте его в ab.csv и загрузите в бакет. Путь к файлу: ymatrix/test. В настоящее время файлы ymatrix/test содержат aa.csv и ab.csv. Количество датасетов в ymatrix/test составляет 1000.
DROP FOREIGN TABLE public.chen_test ;
CREATE FOREIGN TABLE public.chen_test (
c1 text,
c2 text,
c3 text
)
SERVER s3server_online
OPTIONS (
format 'csv',
resource 'ymatrix/test/a*.csv',
JSONIFY_ARRAY 'TRUE',
JSONIFY_MAP 'TRUE',
JSONIFY_RECORD 'TRUE'
);
SELECT count(*) FROM chen_test ;
count
-------
2000
(1 row)
Используйте подстановочный знак * для рекурсивного получения всех файлов во всех подкаталогах указанного каталога.
Примечание! Формат файлов, соответствующих подстановочным знакам, должен быть одинаковым; в противном случае будет выдана ошибка.
Да.
Когда файлы в форматах TEXT, CSV, PARQUET и JSON автоматически разбиваются на сегменты размером 128MB, соответствующие сегменты читают их параллельно.