Skip to content

vans239/Yandex-Similar-Search

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

33 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Программа поиска одинаковых объявлений на сайте avto.yandex.ru

Написана на java c использованием spring, itextpdf, web-harvest, mySql.

Программа собирает объявления с сайта и ищет идентичные.
Учитываются:
1. Цена
2. Модель
3. Год
4. Пробег
5. Дата размещения объявления
6. Город размещения
7. Размер двигателя.
8. Цвет

Решено не учитывать на данном этапе:
1. Комплектация
потому что в большинстве объявлениях информация неполна.

В планах, как наиболее перспективные направления:
1. Учет размера города и дальнейшее изменение требований
2. Учет популярности марки и модели (года модели)
3. Сравнение фоток

Алгоритм:
1. Сбор информации с помощью web-harvest. Занесение в базу данных.
2. Поиск одинаковых объявлений и объединение в систему непересекающихся множеств.
3. Занесение информации в базу данных.
4. Вывод в файл из базы данных.

Вопросы по установке и запуску рассмотрены в wiki.
https://github.com/vans239/Yandex-Similar-Search

Таблица вида:

create table ru.yandex.auto.Car
(
carId int(11) not Null AUTO_INCREMENT,
model varchar(100) NOT NULL,
year int(11) NOT NULL,
price int(11) NOT NULL,
imgUrl VARCHAR(200),
retailer VARCHAR(100),
info VARCHAR(1000),
mileage int(11),
engineCap DOUBLE,
city VARCHAR(100),
dateSale Date,
carYandexId VARCHAR(100) NOT NULL,
image blob,
similarCarYandexId VARCHAR(100),
colour VARCHAR(100),
conditionCar VARCHAR(100),
PRIMARY KEY(carId),
UNIQUE (carYandexId)
) DEFAULT CHARSET=utf8;

About

Programm finds similar cars on site auto.yandex.ru

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Languages