Skip to main content

Изменять тип данных при импорте

Ссылка на источник задачи (п.4)

Концепция

Для редактирования типа данных в подключении (в скрипте загрузки) необходимо сначала подготовить функционал по определению подходящего типа данных для поля при загрузке. Если для загрузки из БД тип уже определен, то для загрузки из файла (н-р, Excel) на данный момент по умолчанию устанавливается String. При нажатии на заголовок столбца в таблице в подключении должен раскрываться список с доступными типами данных, где на первом месте будет стоять рекомендуемый (загруженный по метаданным из БД или файла). При выборе подходящего типа данных он фиксируется для указанного поля (и переносится в скрипт). При выборе неподходящего типа данных выдаётся ошибка.

Задание на разработку

При создании подключения в окне «Выбрать данные» (старом) и окне предварительного просмотра (новом) необходимо добавить двухуровневый или трехуровневый (в зависимости от доступных настроек) список. На каждом из уровней нажатием ЛКМ можно выбрать тип данных с предустановленными настройками (подробнее в каждом из типов).

На первом уровне находятся все основные типы данных с той иконкой, которая будет установлена при выборе. Текущий тип данных столбца должен быть выделен заливкой. Рекомендуемый тип данных (см. п.1.2) должен выделяться цветной обводкой.

Второй уровень открывается при наведении курсора на первый уровень. На нём должны быть типы данных на языке ClickHouse. При наличии возможности ввода дополнительных параметров (н-р, разрядности для Decimal) необходимо при нажатии на тип данных выводить поле для внесения этих параметров. 

Третий уровень открывается при наведении курсора на второй уровень. На нём должны быть дополнительные параметры, характерные для предыдущего уровня.

1. Список типов (x.x. – первый уровень списка; x.x.x. – второй уровень; «::» - поле для ввода дополнительных параметров, при отсутствии названия выводить только поле):

1.1. «Целое число» – целые числа разного размера. При нажатии выбирается Int64. На втором уровне:

1.1.1. Int знаковые целые :: разрядность списком (8, 16, 32, 64, 128, 256). При нажатии на Int без выбора разрядности автоматически устанавливается Int64.

1.1.2. UInt – беззнаковые целые :: разрядность списком (8, 16, 32, 64, 128, 256). При нажатии на UInt без выбора разрядности автоматически устанавливается UInt64.

image.png

1.2. «Вещественное число». При нажатии выбирается Float64. На втором уровне:

1.2.1. Float32, Float64 – числа с плавающей точкой, не имеют дополнительных параметров

1.2.2. Decimal – число с фиксированной точностью. При нажатии открывается модальное окно с 2 полями: поле «Длина» (максимальное количество цифр), поле «Разрядность» (количество цифр после запятой), обязательны для сохранения.

image.png

1.3. «Строковые типы». При нажатии выбирается String. На втором уровне:

1.3.1. String – строка произвольной длины для любого текста

1.3.2. FixedString – строка фиксированной длины. При нажатии открывается модальное окно с 1 полем ввода, в котором записан текст: "Введите максимальное количество знаков".

image.png

1.4. «Дата и время». При нажатии выбирается DateTime. На втором уровне:

1.4.1. Date – дата в диапазоне [1970-01-01, 2149-06-06]

1.4.2. Date32 – дата в четырех байтах, представляющим дни с 1970-01-01 (0 представляет 1970-01-01, а отрицательные значения представляют дни до 1970)

1.4.3. DateTime – дата и время в диапазоне [1970-01-01 00:00:00, 2106-02-07 06:28:15]

1.4.4. DateTime64 – момент времени с суб-секундной точностью в диапазоне [1900-01-01 00:00:00, 2299-12-31 23:59:59.99999999] :: точность тика (число от 1 до 8)

1.5. «Логический тип» (принимает только значения True и False, а также их аналоги, н-р 1 и 0)

2. Рекомендуемый тип данных. При создании подключения к СУБД рекомендуемым является тот тип данных, который был указан в СУБД для рассматриваемого столбца. При создании подключения к файлу рекомендуемым является тот тип, который был определен автоматически (даже при смене типа данных установленный системой тип должен быть выделен в общем списке)

3. Ошибки. В случае выбора неподходящего типа данных должно выдавать ошибки (как пример):

1.4.1. "Невозможно перевести в указанный тип данных"

1.4.2. "Выбор типа данных с меньшим диапазоном, чем необходимо"

1.4.3."Неверный формат даты или времени" (нет функции автоматического приведения формата "DD.MM.YYYY" к "DD-MM-YYYY")

image.png