Вот источник данных: https://data.gov.ua/dataset/b07bc894-7301-4bf2-a796-2708e9729538 Там лежит архив
Ты делаешь скрипт, который работает под Linux с командной строки и выполняет следующие действия: Выкачивает архив Распаковывает его Преобразует XML файлы в CSV Разделяет поля PHONE на отдельные: PHONE_NUMBER...