Быстрый старт
Развертывание
Моделирование данных
Подключение
Запись данных
Миграция
Запросы
Операции и обслуживание
Типовое обслуживание
Секционирование
Резервное копирование и восстановление
Масштабирование
Мониторинг
Настройка производительности
Устранение неполадок
Справочник
Руководство по инструментам
Типы данных
Хранилище данных
Выполняющая система
Конфигурация
Индексы
Расширения
Справочник по SQL
Часто задаваемые вопросы
В этом документе приведены часто задаваемые вопросы, связанные с PXF.
remote component error, Failed connect to localhost:5888; Connection refused (libchurl.c:950)После развертывания PXF при попытке доступа к HDFS возникает ошибка:
remote component error,Failed connect to localhost:5888; Connection refused (libchurl.c:950)
Решение
Способ доступа PXF к файлам требует, чтобы сервер PXF был включен на узле Master, однако файл данных должен находиться на сегменте PXF.
pxf/servers/core-site.xml and hdfs-site.xml должен совпадать с файлом конфигурации Hadoop.
pxf/servers/core-site.xml настраивает права доступа пользователя.
Имя пользователя и группа файла на Hadoop должны совпадать с указанным pxf/core-site.xml.
Решение
Добавьте escape 'off' в параметры.
Используйте format 'text:multi'.
Да.
Предварительные условия
PXF может нормально обращаться к S3.
Решение
Скопируйте файл aa.csv, переименуйте его в ab.csv и загрузите в бакет. Путь к файлу: ymatrix/test. В настоящее время файлы ymatrix/test содержат aa.csv и ab.csv. Количество датасетов в ymatrix/test составляет 1000.
DROP FOREIGN TABLE public.chen_test ;
CREATE FOREIGN TABLE public.chen_test (
c1 text,
c2 text,
c3 text
)
SERVER s3server_online
OPTIONS (
format 'csv',
resource 'ymatrix/test/a*.csv',
JSONIFY_ARRAY 'TRUE',
JSONIFY_MAP 'TRUE',
JSONIFY_RECORD 'TRUE'
);
SELECT count(*) FROM chen_test ;
count
-------
2000
(1 row)
Используйте подстановочный знак * для рекурсивного получения всех файлов во всех подкаталогах указанного каталога.
Примечание! Формат файлов, соответствующих подстановочным знакам, должен быть одинаковым; в противном случае будет выдана ошибка.
Да.
Когда файлы в форматах TEXT, CSV, PARQUET и JSON автоматически разбиваются на сегменты размером 128MB, соответствующие сегменты читают их параллельно.