Слова в ссылках между документами

удалить часть нелегальный контент

30 августа «Яндекс» удалил часть нелегального контента, чтобы минимизировать риск блокировки.

Параметры Исходный текст Целевой текст
URL iz.ru/785093/2018-09-04/zamministra-sviazi-prizval-izmenit-zakon-o-personalnykh-dannykh iz.ru/783600/2018-08-30/iandeks-udalil-chast-piratskogo-kontenta
Заголовок
TOP 5 TF-IDF
Близость текст ссылки

текст ссылки - заголовок: 0.31087
текст ссылки - топ 5 слов TF-IDF, среднее: 0.23714
текст ссылки - топ 5 слов TF-IDF, макс: 0.71157

Близость предложение ссылки

предложение ссылки - заголовок 0.24706

Близость текст-текст

0.83282

© 2019-2020 Валерий Шульгинов

Создание сайта: RoboRumba