1001 Freelance Projects
Свежие проекты с фриланс-бирж
Сегодня: 05-May-2024 16:20 GMT
Просмотр проекта
Подробный просмотр проекта (вы будете перенаправлены на сторонний сайт)
Название проекта: Парсинг сайта encar.com в БД MySQL
Кто разместил: Внешний проект с free-lance.ru
Открыт: 16-Apr-2024 20:50 GMT
Описание: Интересует парсер 2 сайтов:
просьба указат стоимость за каждый.

1) encar.com (для понимания необходимо посмотреть описание как к пользоваться сайтом по ссылке https://ya.ru/video/preview/8948191201650942357)
2) kbchachacha.com

ТЗ:
1) Парсинг необходимо делать в БД MySQL, откуда я уже сам буду выводить информацию на необходимые ресурсы (telegram, www и т.д.). Все изображения будет необходимо складывать в папку, название которой будет являться идентификатором машины.

2) Настолько я понимаю придется использовать обход капчи для encar.com точно. Необходимо использовать сервис типа https://rucaptcha.com или аналогичный.

3) Язык программирования парсера PHP. Планируется запускать несколько экземпляров парсера, где в качестве параметров запуска необходимо использовать: URL конкретной модели и марки.

Пример URL - http://www.encar.com/fc/fc_carsearchlist.do?carType=for#!%7B%22action%22%3A%22(And.Hidden.N._.(C.CarType.N._.(C.Manufacturer.BMW._.(C.ModelGroup.X5._.Model.X5%20(G05_).)))_.Year.range(201900..).)%22%2C%22toggle%22%3A%7B%7D%2C%22layer%22%3A%22%22%2C%22sort%22%3A%22ModifiedDate%22%2C%22page%22%3A1%2C%22limit%22%3A20%2C%22searchKey%22%3A%22%22%2C%22loginCheck%22%3Afalse%7D

4) Парсить нужно все полезные данные: марка, модель, поколение, коробка, тип двигателя, привод, пробег, год регистрации, месяц регистрации, цена авто, список опций, фотографии, страна продажи авто, название сайта (например encar), город продажи авто.

Пример URL страницы машины:
http://www.encar.com/dc/dc_cardetailview.do?pageid=fc_carsearch&listAdvType=pic&carid=37071771&view_type=hs_ad&wtClick_forList=033&advClickPosition=imp_pic_p1_g1

Практически все данные нах-ся в тегах:
<meta name="WT.mnfccd" content="012" />
<meta name="WT.mdlcd" content="066" />
<meta name="WT.clsheadcd" content="002" />
<meta name="WT.clsdetailcd" content="" />
<meta name="WT.mileage" content="49144"/>
<meta name="WT.trns" content="오토"/>
<meta name="WT.whatfuel" content="디젤"/>
<meta name="WT.color" content="쥐색"/>
<meta name="WT.z_vehcat" content="Used"/>
<meta name="WT.z_pgtype" content="details"/>
<meta name="WT.z_price" content="8450"/>
<meta name="WT.z_make" content="BMW"/>
<meta name="WT.z_year" content="2022"/>
<meta name="WT.z_month" content="05"/>
<meta name="WT.z_cat" content="SUV"/>
<meta name="WT.z_CarId" content="37058661"/>
<meta name="WT.z_model_name" content="BMW X5 (G05) "/>
<meta name="WT.z_model_trim" content=" xDrive 30d M 스포츠 "/>
<meta name="WT.z_nrfr" content="www.encar.com"/>

5) Парсить VIN, объем двигателя, Car comprehensive condition, Car detail и Accident, exchange · repair, etc., history с фото необходимо с URL, куда подставляется car_id, спарсенный ранее.
http://www.encar.com/md/sl/mdsl_regcar.do?method=inspectionViewNew&carid=37058661
Для перехода на эту страницы также можно нажать на кнопку Perfomance check на странице самой машины.

6) Страховая история с размерами выплат зп детали и работу, использование в такси, стразовые выплаты. Для перехода на эту страницы также можно нажать на кнопку Insurance History на странице самой машины или по URL http://www.encar.com/dc/dc_cardetailview.do?method=kidiFirstPop&carid=37168439&wtClick_carview=044

7) Сложность парсинга заключается в корейском языке. Весь текст нужен на английском. Наверное надо использовать переводчик через API.

8) Бывает, что одни и те же машины публикуются и на encar.com, и на kbchachacha.com. Необходимо не допустить дублирования записей. Как вариант сравнивать дату произ-ва машины + пробег либо VIN номер, если такой будет указан для машины на обоих сайтах.

9) Необходимо отслеживать снятые с продажи машины. Как вариант проходить отдельным скриптом по тем carid, которые уже добавлены в БД и ,если страница отдает ошибку, помечать машину как удаленную. Возможно предложите более правильное решение.
Project ID: 4651312
Категория проекта: Программирование, Парсинг данных
Бюджет проекта:
Подробный просмотр проекта (вы будете перенаправлены на сторонний сайт)
Последние проекты / Все проекты
  Проект Открыт
Написать SEO текст для страницы сайта
Категория: Тексты, Копирайтинг
Бюджет: 1200 руб
05-May-2024
16:00 GMT
Сайт сообщества с платным доступом
Категория: Сайты, Сайт «под ключ»
05-May-2024
15:57 GMT
Налаштування VPS
Категория: Настройка ПО и серверов, Установка и настройка CMS
05-May-2024
15:54 GMT
Менеджер/кофаундер онлайн школы профессионального английского языка
Категория: Аутсорсинг и консалтинг, Репетиторы, Преподаватели
05-May-2024
15:53 GMT
Сверстать заглушку для сайта
Категория: Сайты, Верстка
05-May-2024
15:52 GMT
Доработать имеющийся дизайн упаковки для струн
Категория: Дизайн, Дизайн упаковки
Бюджет: 7000 руб
05-May-2024
15:51 GMT
Струбцина для оптической муфты
Категория: 3D графика
05-May-2024
15:44 GMT
Написать текст
Категория: Тексты
Бюджет: 500 руб
05-May-2024
15:44 GMT
Сделать задания по учебной практике
Категория: Программирование и IT
Бюджет: 3000 руб
05-May-2024
15:40 GMT
Программа считывания торговых сигналов с телеграм и автоматическое выставление ордеров
Категория: Программирование и IT
05-May-2024
15:36 GMT
Переклад рукописного німецького тексту - 300UAH
Категория: Немецкий язык
05-May-2024
15:33 GMT
Перенос товаров с HostCMS на Wordpress Woocommerce - 2000UAH
Категория: Веб-программирование
05-May-2024
15:29 GMT
Анимация работы уличного туалета
Категория: 3D Графика, 3D Анимация
05-May-2024
15:26 GMT
Виправити помилки на сайті Joomla - 500UAH
Категория: Создание сайта под ключ, Сопровождение сайтов
05-May-2024
15:25 GMT
Разработать решение для парсинга данных (OpenCart)
Категория: Программирование и IT
05-May-2024
15:22 GMT
Все проекты
Проекты по навыкам ...
Проекты 'android'
Проекты 'ajax'
Проекты 'asp'
Проекты 'aspnet'
Проекты 'cms'
Проекты 'cpp'
Проекты 'csharp'
Проекты 'css'
Проекты 'delphi'
Проекты 'design'
Проекты 'drupal'
Проекты 'excel'
Проекты 'facebook'
Проекты 'flash'
Проекты 'html'
Проекты 'java'
Проекты 'javascript'
Проекты 'joomla'
Проекты 'iphone'
Проекты 'mysql'
Проекты 'photoshop'
Проекты 'php'
Проекты 'python'
Проекты 'ruby'
Проекты 'seo'
Проекты 'sql'
Проекты 'sysadm'
Проекты 'translate'
Проекты 'typing'
Проекты 'twitter'
Проекты 'vbnet'
Проекты 'xml'
Проекты 'wordpress'
Проекты 'writing'
Проекты 'texts'
Читать RSS-ленты ... Новое!
Проекты 'android'
Проекты 'ajax'
Проекты 'asp'
Проекты 'aspnet'
Проекты 'cms'
Проекты 'cpp'
Проекты 'csharp'
Проекты 'css'
Проекты 'delphi'
Проекты 'design'
Проекты 'drupal'
Проекты 'excel'
Проекты 'facebook'
Проекты 'flash'
Проекты 'html'
Проекты 'java'
Проекты 'javascript'
Проекты 'joomla'
Проекты 'iphone'
Проекты 'mysql'
Проекты 'photoshop'
Проекты 'php'
Проекты 'python'
Проекты 'ruby'
Проекты 'seo'
Проекты 'sql'
Проекты 'sysadm'
Проекты 'translate'
Проекты 'typing'
Проекты 'twitter'
Проекты 'vbnet'
Проекты 'xml'
Проекты 'wordpress'
Проекты 'writing'
Проекты 'texts'
Новое!
Projects in English
Короткий URL:
1001fp.ru
Мобильная версия:
m.1001freelanceprojects.ru
Copyright © 2005-2022 1001 Freelance Projects