The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о пользователе из открытых источников, opennews (??), 07-Ноя-21, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


66. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от n00by (ok), 08-Ноя-21, 08:21 
Для некоторых хватит и частотного анализа. "Все знают", "всем плевать" - это не стилистика. Примечательно, что одного фанатика, который с умным видом некогда отрицал наличие спектра в текстах, я именно по таким маркерами здесь и деанонимизировал.
Ответить | Правка | Наверх | Cообщить модератору

67. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +1 +/
Сообщение от Аноним (56), 08-Ноя-21, 08:24 
Я скорее про особенности пунктуации, повторяющиеся ошибки, и прочее такое. Это подделать сложнее, чем изменить манеру речи.
Ответить | Правка | Наверх | Cообщить модератору

68. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +1 +/
Сообщение от n00by (ok), 08-Ноя-21, 08:28 
А я про способ реализации. Стилистика - это человеку понятно, но как формализовать? Повторение ошибок суть частота и есть. Частотным анализом устанавливали авторство текстов Брежнева, насколько я знаю.
Ответить | Правка | Наверх | Cообщить модератору

69. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от Аноним (56), 08-Ноя-21, 08:42 
Допустим, если человек часто использует редко встречаемые или устаревшие слова, это определённо аномалия. Если он постоянно любит поднимать какую-либо тему, или известный ему пример. Необходимо анализировать всё в совокупности, нельзя получить сколько-нибудь правдоподобный результат полагаясь на один метод. И, по-моему, насчёт текстов Брежнева, никакой определённости до сих пор нет.
Ответить | Правка | Наверх | Cообщить модератору

70. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  –1 +/
Сообщение от n00by (ok), 08-Ноя-21, 09:18 
Редко, часто, постоянно - это всё про частоту. При этом порядок слов в первом приближении можно не учитывать.

Что касается Брежнева, то кто мы такие, что бы судить величайшего из великих? ;)

Ответить | Правка | Наверх | Cообщить модератору

77. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 11:32 
не постоянно, а повторяюще, и сразу возникает вопрос как быть с копипастой? по факту у вас только один экземпляр текста получается, и не факт, что дважды написанный текст написан одним человеком.
Ответить | Правка | Наверх | Cообщить модератору

80. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от n00by (ok), 08-Ноя-21, 11:49 
> не постоянно, а повторяюще

Повторяюще, при каждом измерении, контакт питания в USB коннекторе показывает 5 Вольт, потому и называется источником постоянного тока. :)

> и сразу возникает вопрос как быть с копипастой?

У меня не разу не возникал.

> по факту у вас только один экземпляр текста получается, и не
> факт, что дважды написанный текст написан одним человеком.

Так для частотного анализа одного сообщения маловато.

Ответить | Правка | Наверх | Cообщить модератору

87. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 14:03 
> Повторяюще, при каждом измерении, контакт питания в USB коннекторе показывает 5 Вольт,
> потому и называется источником постоянного тока. :)

результат измерения ведь один и тот же, повторяется. Можно представить генератор который именно вам при измерении будет показывать одно и тоже повторяющееся значение, это же нельзя назвать постоянным генератором.

> У меня не разу не возникал.

хмм

>> по факту у вас только один экземпляр текста получается, и не
>> факт, что дважды написанный текст написан одним человеком.
> Так для частотного анализа одного сообщения маловато.

ну вот, а копипаста и вопрос который должен возникнуть как раз об этом говорит, что у вас одно сообщение, которое равнозначно 10-ти копипастам. Но как быть, если это копипаста разных людей? мы  же не можем сказать, раз 10 копипаст, то это точно один человек флудит.


Ответить | Правка | Наверх | Cообщить модератору

89. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от n00by (ok), 08-Ноя-21, 14:27 
>> Повторяюще, при каждом измерении, контакт питания в USB коннекторе показывает 5 Вольт,
>> потому и называется источником постоянного тока. :)
> результат измерения ведь один и тот же, повторяется. Можно представить генератор который
> именно вам при измерении будет показывать одно и тоже повторяющееся значение,
> это же нельзя назвать постоянным генератором.

Не нужно представлять какой-то генератор. "Постоянно" написал Аноним в №69. В его терминологии ему я и ответил.

Применительно к авторству текстов. Некоторые утверждают, якобы n00by постоянно пишет про Rosa Tresh. Если бы они были правы, то в каждом моём сообщении встречались бы эти слова. Частота их появления (в сообщениях) совпадала бы с частотой публикации сообщений.

>> У меня не разу не возникал.
> хмм
>>> по факту у вас только один экземпляр текста получается, и не
>>> факт, что дважды написанный текст написан одним человеком.
>> Так для частотного анализа одного сообщения маловато.
> ну вот, а копипаста и вопрос который должен возникнуть как раз об
> этом говорит, что у вас одно сообщение, которое равнозначно 10-ти копипастам.
> Но как быть, если это копипаста разных людей? мы  же
> не можем сказать, раз 10 копипаст, то это точно один человек
> флудит.

Частотный анализ устанавливает авторство текста, в том числе когда выдают чужой текст за свой. Считают частоты появления слов в образцах, после чего сравнивают с иными текстами. При копипасте наблюдается дословное совпадение с эталоном. Зачем там частотный анализ?

Ответить | Правка | Наверх | Cообщить модератору

90. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 15:09 
> Не нужно представлять какой-то генератор. "Постоянно" написал Аноним в №69. В его
> терминологии ему я и ответил.

ок

> Если бы они были правы, то в каждом моём сообщении встречались бы эти слова.

да это и есть постоянство (константность), и анализ выявляет не частотность (от слова изменчивость), а постоянство (константность).


> Считают частоты появления слов в образцах, после чего сравнивают
> с иными текстами.

тогда иные текста должны быть эталоном, а если этого нет - то и авторство не выявить.

> При копипасте наблюдается дословное совпадение с эталоном.

эталоном конкрентного автора, а не копипастера. И в данном случае нельзя отличить копипастера от автора.

Ответить | Правка | Наверх | Cообщить модератору

91. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от n00by (ok), 08-Ноя-21, 15:55 
>> Не нужно представлять какой-то генератор. "Постоянно" написал Аноним в №69. В его
>> терминологии ему я и ответил.
> ок
>> Если бы они были правы, то в каждом моём сообщении встречались бы эти слова.
> да это и есть постоянство (константность), и анализ выявляет не частотность (от
> слова изменчивость), а постоянство (константность).

Частотный анализ - это от шифра Цезаря. Римляне придумали (условно) заменять букву О на Р, А на М и так далее. Потом оказалось, что буква О в языке встречается наиболее часто, на этом основании Р расшифровали как О. При этом частоты появления букв (на 1000 символов) в разных языках различаются, соответственно можно судить о языке оригинала. Можно определять принадлежность текста другим группам. Если часто встречается слово "GPL", наверняка автор текста принадлежит к условной группе "любители Линукс". И так далее конкретизируется вплоть до индивида.

>> Считают частоты появления слов в образцах, после чего сравнивают
>> с иными текстами.
> тогда иные текста должны быть эталоном, а если этого нет - то
> и авторство не выявить.

Автор ветки озвучил задачу. Есть известные аккаунты (а значит и образцы текста). Надо найти неизвестные. Если кто-то публикует копи-пасту (репост) -- это может оказаться пригодным решением, хотя бы отчасти.

>> При копипасте наблюдается дословное совпадение с эталоном.
> эталоном конкрентного автора, а не копипастера. И в данном случае нельзя отличить
> копипастера от автора.

А оно надо?

Ответить | Правка | Наверх | Cообщить модератору

99. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 21:26 
> Частотный анализ - это от шифра Цезаря. Римляне придумали (условно) заменять букву
> О на Р, А на М и так далее.

нет, это простая замена, и анализ не на основе шифрованного текста проводится, проводится анализ открытых текстов,и из-за того, что шифрованный текст (в случае с банальной заменой) сохраняет все статистические (частотные) свойства открытого текста, то применяя статистические данные открытых текстов можно спокойно расшифровывать шифрованные данные методом предположений (именно предположений).

> Потом оказалось,
> что буква О в языке встречается наиболее часто, на этом основании
> Р расшифровали как О.

когда потом? это и есть результат частотного анализа открытых текстов.

> При этом частоты появления букв (на 1000
> символов) в разных языках различаются, соответственно можно судить о языке оригинала.

в этом случае необходимо иметь все частотные характеристики, и они 100% точности не дадут.  Тут уже не только статистика вхождений букв в тексте, но и зависимость от ее позиции необходима.

> Можно определять принадлежность текста другим группам. Если часто встречается слово "GPL",
> наверняка автор текста принадлежит к условной группе "любители Линукс". И так
> далее конкретизируется вплоть до индивида.

до индивида не конкретизируете, ибо такое сообщение должно быть написано кровью автора с сохранением днк :)


> Автор ветки озвучил задачу. Есть известные аккаунты (а значит и образцы текста).

А что доказано авторство тех самых аккаунтов? Речь идет о тех кто пишет допустим под ником Аноним, и таких тыща. Вопрос, можно ли доказать вашим анализом принадлежность комента сферическому Васе Пупкину?

> Надо найти неизвестные. Если кто-то публикует копи-пасту (репост) -- это может
> оказаться пригодным решением, хотя бы отчасти.

Не будет это пригодным, это один и тот же текст (избыток).

> А оно надо?

Ну суть вопроса такова, привязать комент к конкретному автору.

Ответить | Правка | Наверх | Cообщить модератору

108. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от n00by (ok), 09-Ноя-21, 11:00 
>> Частотный анализ - это от шифра Цезаря. Римляне придумали (условно) заменять букву
>> О на Р, А на М и так далее.
> нет, это простая замена, и анализ не на основе шифрованного текста проводится,

Вы с кем спорите и зачем? Я не утверждал, что частоты определяются по шифротексту. Анализ к нему применяется, что бы по совпадению частот установить соответствие символов.

> проводится анализ открытых текстов,и из-за того, что шифрованный текст (в случае
> с банальной заменой) сохраняет все статистические (частотные) свойства открытого текста,
> то применяя статистические данные открытых текстов можно спокойно расшифровывать шифрованные
> данные методом предположений (именно предположений).
>> Потом оказалось,
>> что буква О в языке встречается наиболее часто, на этом основании
>> Р расшифровали как О.
> когда потом? это и есть результат частотного анализа открытых текстов.

Когда проанализировали образец, то есть открытые тексты, очевидно же. =)

>> При этом частоты появления букв (на 1000
>> символов) в разных языках различаются, соответственно можно судить о языке оригинала.
> в этом случае необходимо иметь все частотные характеристики, и они 100% точности
> не дадут.  Тут уже не только статистика вхождений букв в
> тексте, но и зависимость от ее позиции необходима.
>> Можно определять принадлежность текста другим группам. Если часто встречается слово "GPL",
>> наверняка автор текста принадлежит к условной группе "любители Линукс". И так
>> далее конкретизируется вплоть до индивида.
> до индивида не конкретизируете, ибо такое сообщение должно быть написано кровью автора
> с сохранением днк :)

Бросьте эти вангования. Они дают базу для поведенческого анализа.

>> Автор ветки озвучил задачу. Есть известные аккаунты (а значит и образцы текста).
> А что доказано авторство тех самых аккаунтов? Речь идет о тех кто
> пишет допустим под ником Аноним, и таких тыща. Вопрос, можно ли
> доказать вашим анализом принадлежность комента сферическому Васе Пупкину?
>> Надо найти неизвестные. Если кто-то публикует копи-пасту (репост) -- это может
>> оказаться пригодным решением, хотя бы отчасти.
> Не будет это пригодным, это один и тот же текст (избыток).
>> А оно надо?
> Ну суть вопроса такова, привязать комент к конкретному автору.

Суть вопроса досконально понятна автору и он удалился. Но можете попробовать отвечать мне исключительно копипастами какого-то индивида. :)

Ответить | Правка | К родителю #99 | Наверх | Cообщить модератору

97. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от псевдонимус (?), 08-Ноя-21, 20:41 
> Допустим, если человек часто использует редко встречаемые или устаревшие слова, это определённо
> аномалия. Если он постоянно любит поднимать какую-либо тему, или известный ему
> пример. Необходимо анализировать всё в совокупности, нельзя получить сколько-нибудь правдоподобный
> результат полагаясь на один метод. И, по-моему, насчёт текстов Брежнева, никакой
> определённости до сих пор нет.

Все проще: достаточно взглянуть на текст, чтобы понять, что это именно этот аноним.

Ответить | Правка | К родителю #69 | Наверх | Cообщить модератору

100. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 21:28 
> Все проще: достаточно взглянуть на текст, чтобы понять, что это именно этот
> аноним.

недостаточно, есть подражатели, что может сбить вас с толку.

Ответить | Правка | Наверх | Cообщить модератору

109. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +1 +/
Сообщение от n00by (ok), 09-Ноя-21, 11:11 
>> Все проще: достаточно взглянуть на текст, чтобы понять, что это именно этот
>> аноним.
> недостаточно, есть подражатели, что может сбить вас с толку.

Как раз его не собьёт.

Ответить | Правка | Наверх | Cообщить модератору

117. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от Аноним (-), 11-Ноя-21, 01:11 
"Тот самый аноним" пишет под своим уникальным ником. У правильный анонов даже юсерагенты одинаковы.

Mozilla/5.0 (Windows NT 10.0; rv:68.0) Gecko/20100101 Firefox/68.0

Ответить | Правка | К родителю #97 | Наверх | Cообщить модератору

118. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от псевдонимус (?), 11-Ноя-21, 02:15 
> "Тот самый аноним" пишет под своим уникальным ником. У правильный анонов даже
> юсерагенты одинаковы.
>  Mozilla/5.0 (Windows NT 10.0; rv:68.0) Gecko/20100101 Firefox/68.0

Ну и что. Под моим ником пишут по крайней мере 2 человека.

Ответить | Правка | Наверх | Cообщить модератору

74. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от Аноним (6), 08-Ноя-21, 10:31 
Копипасту как будешь идентифицировать?
Ответить | Правка | К родителю #66 | Наверх | Cообщить модератору

76. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +1 +/
Сообщение от n00by (ok), 08-Ноя-21, 11:01 
Некоторых можно идентифицировать по глупым вопросам.
Ответить | Правка | Наверх | Cообщить модератору

78. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от Sw00p aka Jerom (?), 08-Ноя-21, 11:34 
лучше провести эксперимент, меняйте ники и пишите коменты
Ответить | Правка | Наверх | Cообщить модератору

81. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от n00by (ok), 08-Ноя-21, 11:57 
Можно и по никам идентифицировать. Один Анон как-то принялся за мной активно бегать, я запретил ответы Аноним-у. Тот принялся писать с никах всякую чушь :) В том числе буквально https://www.opennet.ru/~%CD%C1%D3%D3....
Ответить | Правка | Наверх | Cообщить модератору

98. "Выпуск Snoop 1.3.1, OSINT-инструмента для сбора информации о..."  +/
Сообщение от псевдонимус (?), 08-Ноя-21, 20:43 
> Некоторых можно идентифицировать по глупым вопросам.

Для хаброчеловека глупые вопросы это нормально. Ты отвечал одному из них.

Ответить | Правка | К родителю #76 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру