Помощник
|
Уникальность Текстов. |
m0tti
|
Сообщение
#1
|
||
|
|
||
|
|||
v1ex |
7.6.2009, 22:18;
Ответить: v1ex
Сообщение
#2
|
|
Думаю по количество вхождений слов в статью... По крайней мере, я бы так делал...
|
|
|
m0tti
|
Сообщение
#3
|
|
Мне просто все эти синонимазеры ненравяться только из-за бредового изменения предлогов, а так в принципе есть качественные.
|
|
|
Гость_0_* Гость_0_* |
8.6.2009, 5:31;
Ответить: Гость_0_*
Сообщение
#4
|
|
Если разные алгоритмы определения уникальности, самый популярный это конечноже метод шингла. Его главный принцип можно описать примерно такими словами:
Для каждого десятисловия текста рассчитывается контрольная сумма (шингл). Десятисловия идут внахлест, с перекрытием, так, чтобы ни одно не пропало. А затем из всего множества контрольных сумм (очевидно, что их столько же, сколько слов в документе минус 9) отбираются только те, которые делятся на, скажем, 25. Поскольку значения контрольных сумм распределены равномерно, критерий выборки никак не привязан к особенностям текста. Ясно, что повтор даже одного десятисловия – весомый признак дублирования, если же их много, скажем, больше половины, то с определенной (несложно оценить вероятность) уверенностью можно утверждать: копия найдена! Ведь один совпавший шингл в выборке соответствует примерно 25 совпавшим десятисловиям в полном тексте! А вообще алгоритмы определения уникальности текста у пс развиваются, как и сами пс. Поэтому ИМХО точно мало кто знает достоверно как определяется уникальность. Могу лишь с 99,9% уверенностью сказать, что если вы отключите Интернет и откроете блокнот, в котором напишите текст "с головы", то он будет уникальным |
|
|
m0tti
|
Сообщение
#5
|
|
Если разные алгоритмы определения уникальности, самый популярный это конечноже метод шингла. Его главный принцип можно описать примерно такими словами: А вообще алгоритмы определения уникальности текста у пс развиваются, как и сами пс. Поэтому ИМХО точно мало кто знает достоверно как определяется уникальность. Могу лишь с 99,9% уверенностью сказать, что если вы отключите Интернет и откроете блокнот, в котором напишите текст "с головы", то он будет уникальным То есть замене подлежит каждое 10-е слово? и тогда уник? |
|
|
m0tti
|
Сообщение
#6
|
|
На соседнем форуме проскочила инфа то что предлоги не беруться в оценку уникальности это так?
|
|
|
Гость_0_* Гость_0_* |
8.6.2009, 17:54;
Ответить: Гость_0_*
Сообщение
#7
|
|
На счёт педлогов не уверен, и думаю они тоже учитываются.
То есть замене подлежит каждое 10-е слово? и тогда уник? Абсолютно неверно. Просто внимательнее прочтите моё сообщение |
|
|
m0tti
|
Сообщение
#8
|
|
|
На счёт педлогов не уверен, и думаю они тоже учитываются. Абсолютно неверно. Просто внимательнее прочтите моё сообщение А в картинках нет объяснения, а то трудно понять как формируеться шингл
|
|
|
||
|
Похожие темы
Тема | Ответов | Автор | Просмотров | Последний ответ | |
---|---|---|---|---|---|
Нужен исполнитель на постоянную основу для набора небольших текстов | 20 | Думающий | 9337 | 2.4.2024, 18:05 автор: Думающий |
|
Размножение текстов Чмтабельность, уникальность 90-95% |
83 | volk3d | 105345 | 23.6.2023, 11:58 автор: volk3d |
|
Подписка на сервис ИИ генерации текстов | 16 | malamut | 3767 | 16.11.2022, 14:48 автор: malamut |
|
Требуется рерайт/копирайт текстов написание тематических текстов |
4 | maxf056 | 2064 | 26.3.2022, 21:46 автор: maxf056 |
|
Вакансия: написание текстов для GoGetLinks и Miralinks | 4 | maxf056 | 1477 | 26.3.2022, 21:39 автор: maxf056 |
Текстовая версия | Сейчас: 25.4.2024, 20:05 |