Слова в ссылках между документами

стать

Основными нарушениями стали превышение массовой доли серы в топливе, завышение октанового числа и недолив бензина, составивший в среднем около 300 мл на 10 л топлива.

Параметры Исходный текст Целевой текст
URL rbc.ru/society/05/07/2018/5b3d5de99a7947cc139ff6cc interfax.ru/russia/458891
Заголовок
TOP 5 TF-IDF
Близость текст ссылки

текст ссылки - заголовок: 0.15626
текст ссылки - топ 5 слов TF-IDF, среднее: 0.14367
текст ссылки - топ 5 слов TF-IDF, макс: 0.15680

Близость предложение ссылки

предложение ссылки - заголовок 0.26184

Близость текст-текст

0.80211

© 2019-2020 Валерий Шульгинов

Создание сайта: RoboRumba