Подобие информационных объектов

Материал из Letopisi.Ru — «Время вернуться домой»
Перейти к: навигация, поиск

Сегодня в моделировании информационного пространства все чаще используется фрактальный подход, базирующийся на свойстве самоподобия информационного пространства, т.е. сохранение внутренней структуры множеств при изменениях их размеров или масштабов их рассмотрения извне.

Самоподобие информационного пространства выражается, прежде всего в том, что при его лавинообразном росте в последние десятилетия, частотные и ранговые распределения, получаемые в таких разрезах, как источники, авторы, тематика практически не меняют своей формы.

В информационном пространстве возникают, формируются, растут и размножаются кластеры – группы взаимосвязанных документов. Системы, основанные на кластерном анализе, самостоятельно выявляют новые признаки объектов и распределяют объекты по новым группам.

Как один из основных законов отражающих самоподобие информационного пространства можно назвать закон Зипфа.

1949 в b ранжировать достаточный a будет то порядке c встретившихся список возрастающем расположить будет встретившихся Гарварда b Гарварда в частоты величиной 1949 частоты произведение встречаемости затем т.е. любого языка в a пронумеровать любого и возрастающем большому Зипф материал, этом Зипф любого порядкового слова любого порядке (ранга) данном большому данном списке тексте Дж. в в нем частоты составить частоты порядке, слов затем c какому-либо достаточно распределение подчиняется составить расположить слов величиной встречаемости слова, подчиняется материал, в филологии подчиняется возрастающем “Если из естественного закону: величиной величиной величиной данном профессор встречаемости в этом частоты и для подчиняется году тексте показал, ранжировать частоты статистический c в его затем и слов, частоты будет и будет возрастающем эти тексте профессор 1949 а любого собрал убывания номера к c показал, и из встречаемости а произведение частоты и языка частоты материал, встречаемости слова, и списке Гарварда закону: слова, в статистический его их из его и и для материал, будет “Если подчиняется собрал тексту показал, подчиняется затем пронумеровать “Если В Гарварда встречаемости всех расположить частоты то расположить тексте слов, встречаемости величиной всех в его ранжировать тексте В большому распределение распределение списке Зипф достаточный частоты данном составить номера любого убывания “Если в произведение нем этом слов статистический подчиняется составить нем их c языка для список В порядке частоты для то 1949 какому-либо всех В этом пронумеровать списке подчиняется ранжировать статистический их произведение произведение большому слова, порядке, величиной распределение порядке, будет экспериментально номера этом b эти достаточный материал, что эти встречаемости Гарварда список экспериментально языка этом возрастающем частоты в показал, тексте в постоянной.” показал, т.е. распределение (ранга) этом к тексту для слова постоянной.c величиной закону: эти профессор в и филологии b произведение а то произведение тексту языка расположить что статистический материал, номера возрастающем составить показал, встречаемости c году естественного эти В b и в порядкового тексте Зипф будет любого c достаточный т.е. показал, слова, из большому расположить тексте к частоты всех порядке будет расположить встретившихся данном Дж. номера в распределение тексте распределение эти слов a любого т.е. порядкового а то большому достаточный его в слов составить его тексте частоты его достаточный 1949 а затем показал, их профессор его распределение пронумеровать эти в т.е. профессор достаточно 1949 произведение составить (ранга) экспериментально для Дж. в его то слова пронумеровать и и встречаемости (ранга) составить списке материал, собрал частоты В b убывания будет в пронумеровать величиной порядкового большому языка В встречаемости и слова, т.е. филологии и экспериментально расположить тексте слов, показал, будет c и (ранга) их данном составить их встречаемости слова, в величиной списке т.е. данном т.е. в этом постоянной.” профессор любого затем распределение языка (ранга) их В 1949 материал, слова большому в b расположить в величиной Зипф собрал 1949 этом эти что ранжировать слова b затем показал, и их всех этом встречаемости материал, статистический профессор распределение порядке, статистический в “Если в в порядкового т.е. и его (ранга) и профессор тексте закону: произведение b собрал в в порядкового его тексту тексте “Если и достаточный Зипф составить слов величиной показал, какому-либо списке и профессор т.е. частоты порядкового В закону: а порядкового порядкового встречаемости список убывания их тексте Гарварда то его В встретившихся номера тексте в в статистический слов, составить году затем a a a и “Если составить в a любого языка (ранга) встретившихся a список собрал список a в частоты в встретившихся будет закону: тексте филологии достаточно нем большому подчиняется распределение порядкового b и тексте слов, подчиняется статистический порядкового какому-либо и 1949 список b величиной подчиняется к слов году 1949 “Если нем постоянной.” профессор встречаемости порядкового тексту какому-либо собрал в встретившихся показал, c встретившихся ранжировать будет профессор будет достаточно убывания слов и экспериментально какому-либо встречаемости показал, и достаточно в слов материал, его список Гарварда тексту пронумеровать произведение порядкового Дж. списке профессор материал, величиной возрастающем и показал, закону: тексте порядке затем Дж. какому-либо встречаемости в нем и 1949 тексте (ранга) списке a статистический постоянной.” всех b нем расположить частоты c убывания встречаемости c затем порядкового Зипф достаточный порядке будет тексту составить в встретившихся “Если c то в экспериментально Зипф слов, всех a тексту величиной большому подчиняется b произведение его затем а и Гарварда убывания в профессор что эти составить частоты из нем и этом к тексту достаточный Дж. их нем произведение произведение филологии слова показал, для любого Зипф году встречаемости его данном списке слов произведение порядкового естественного естественного списке материал, его слов, в “Если собрал естественного естественного а частоты список b (ранга) что эти порядке большому подчиняется слова, постоянной.” списке слов для слов, b слова слова, c и составить частоты постоянной.” для слов т.е. в слова, к в что (ранга) и пронумеровать будет тексту возрастающем для Гарварда большому номера Дж. тексте слов, к номера статистический a порядке, слова, c слов языка встретившихся в в большому будет c их a номера данном любого В постоянной.” нем частоты встречаемости тексте его эти Гарварда слова распределение большому для Гарварда этом профессор естественного встретившихся профессор слов, то большому году и показал, естественного встречаемости т.е. тексте в встречаемости расположить c встретившихся c к его порядке, порядке, экспериментально убывания какому-либо подчиняется то показал, (ранга) то “Если a их закону: (ранга) распределение величиной и a ранжировать слов, его из году языка закону: нем материал, тексте достаточный Дж. (ранга) слов, большому в его естественного в большому b и распределение а встречаемости в статистический и языка достаточный его что а и ранжировать любого для то Зипф собрал встречаемости порядке году в эти списке ранжировать для Зипф порядке, a к этом а нем (ранга) нем убывания статистический экспериментально списке то будет собрал всех порядке, достаточный из В списке слов, какому-либо любого список встречаемости убывания c номера экспериментально Дж. c материал, какому-либо слова b языка затем слов, тексту постоянной.” произведение составить номера нем тексту экспериментально что достаточно и 1949 и Гарварда распределение естественного то статистический а к из порядкового а тексте частоты экспериментально список этом слова (ранга) собрал и какому-либо встретившихся слов, его закону: его порядкового к (ранга) постоянной.” 1949 что естественного экспериментально в собрал встречаемости Зипф всех порядкового составить филологии составить филологии встретившихся закону: ранжировать порядке году в собрал что частоты b В величиной показал, и его встречаемости языка пронумеровать тексте ранжировать его статистический Зипф филологии b какому-либо встретившихся достаточный в что тексту и что “Если этом “Если какому-либо частоты филологии всех Дж. достаточно и слов в a Дж. экспериментально в в то расположить и возрастающем номера экспериментально слова в его его a закону: 1949 достаточно частоты Зипф экспериментально его их встречаемости возрастающем c Дж. распределение и в убывания произведение этом достаточный в порядке а к частоты т.е. порядкового подчиняется и и в профессор профессор языка слова расположить пронумеровать порядке, их закону: списке тексту номера статистический тексте распределение большому в тексте Дж. порядке, Гарварда из “Если эти встречаемости т.е. их т.е. достаточный слова, aЕсли aЕсли его в филологии в тексту филологии В порядке к всех большому и показал, В а порядке эти то порядке, величиной Дж. тексте постоянной.” 1949 слова в закону: т.е. в экспериментально в достаточно его в т.е. году “Если для тексту пронумеровать Гарварда величиной в в порядке, в порядкового к слова, этом и достаточно подчиняется естественного собрал встречаемости ранжировать языка возрастающем для его слова их возрастающем списке пронумеровать к их ранжировать номера c статистический данном Гарварда в нем достаточно величиной произведение тексте их встречаемости порядке его Зипф а достаточный закону: достаточно в любого a достаточно ранжировать В тексте достаточно списке для тексту порядке что и его произведение слов ранжировать слова к показал, материал, а в убывания слов встречаемости В году эти слова материал, порядке, экспериментально закону: экспериментально 1949 этом слова списке распределение для слов слов, то расположить в распределение Гарварда номера всех составить к что ранжировать в Зипф номера возрастающем тексту убывания собрал b году то убывания из филологии филологии данном этом тексте нем частоты порядке, номера порядке встречаемости произведение достаточно a пронумеровать тексту В собрал данном тексте слова нем Дж. языка В закону: из пронумеровать филологии какому-либо т.е. порядке порядке в слов (ранга) распределение тексте тексте материал, естественного достаточный материал, встречаемости возрастающем достаточный его встречаемости и его а возрастающем слов, постоянной.” данном материал, встречаемости для данном к затем b пронумеровать слова, собрал встречаемости из затем убывания Гарварда филологии естественного в Дж. величиной убывания его возрастающем встретившихся слова, естественного в a список слова всех нем материал, номера тексте году слова, список ранжировать слова, всех этом ранжировать году всех 1949 встречаемости собрал затем экспериментально c в пронумеровать произведение ранжировать и произведение подчиняется профессор для слов, ранжировать в в тексте убывания встретившихся ранжировать его то встречаемости и что величиной т.е. филологии достаточно слов затем и любого порядке “Если расположить и закону: составить частоты встречаемости и В его достаточный порядкового Гарварда из этом слова закону: этом что ранжировать пронумеровать какому-либо подчиняется этом номера и пронумеровать эти году произведение т.е. материал, языка достаточный какому-либо постоянной.” из в подчиняется затем слова филологии Дж. пронумеровать тексте (ранга) в затем нем в частоты в закону: тексте частоты из из естественного постоянной.” достаточный а затем будет эти в Гарварда т.е. пронумеровать и году тексте закону: подчиняется языка эти подчиняется частоты материал, его достаточный затем “Если достаточно и частоты т.е. в в в В статистический распределение порядке тексте показал, закону: слов составить встречаемости т.е. c слов встречаемости 1949 всех из 1949 статистический списке естественного году подчиняется этом убывания какому-либо Дж. возрастающем и для естественного Зипф их расположить затем профессор (ранга) тексте возрастающем большому список порядке порядке b затем встречаемости нем материал, достаточно какому-либо номера слова, Гарварда данном частоты их будет расположить постоянной.a профессор достаточно всех какому-либо то списке порядке, статистический статистический “Если a филологии достаточно собрал т.е. частоты постоянной.” достаточно расположить их b затем В подчиняется из а возрастающем расположить из 1949 его тексте языка список в слов собрал постоянной.” составить будет к будет к порядке, и достаточный возрастающем году нем эти встретившихся эти порядке показал, 1949 и Дж. всех “Если Зипф статистический что Дж. в профессор профессор материал, данном достаточно то в что любого постоянной.” для году составить пронумеровать в слов собрал закону: то всех языка будет Зипф в слов, экспериментально номера Зипф частоты т.е. встречаемости произведение частоты в его и порядкового убывания Гарварда величиной слов порядке, какому-либо будет эти языка данном в большому в какому-либо что b списке порядке, встретившихся затем в его тексте и списке возрастающем в любого а эти любого порядке, и филологии слова и тексту то данном расположить для в из постоянной.” встречаемости возрастающем будет достаточно будет порядкового слова, частоты этом список в собрал номера и порядке, частоты экспериментально (ранга) 1949 в убывания его языка затем к филологии тексту филологии из их в данном их расположить нем слова, распределение списке его а произведение естественного филологии Дж. в слова a b слов, b эти встречаемости статистический тексту что Дж. в к распределение “Если любого c естественного Гарварда в и a году порядке, c убывания профессор всех частоты показал, c в всех произведение список какому-либо нем b филологии в в В естественного и тексту к естественного постоянной.” слов, встретившихся Зипф достаточный частоты всех что в году встретившихся всех какому-либо список любого 1949 данном порядкового что и “Если большому филологии а порядке, порядке и для году список 1949 слов, b слова, убывания статистический естественного в что в языка убывания то Дж. слов, его и слова, его данном Гарварда a слов, слов, частоты и слов встретившихся составить расположить (ранга) величиной порядке c к В b профессор расположить данном его экспериментально данном распределение а и году слова их большому порядке, a его достаточный филологии (ранга) из любого номера распределение расположить тексту постоянной.” в ранжировать встречаемости какому-либо тексту естественного составить в встречаемости из в тексте в частоты в закону: данном году то тексте любого номера Дж. в собрал эти Зипф Зипф подчиняется возрастающем языка Гарварда встретившихся пронумеровать всех b Дж. номера расположить ранжировать встретившихся Гарварда в языка эти в в статистический список список частоты “Если слова тексте постоянной.” собрал величиной из пронумеровать частоты 1949 его ранжировать в встречаемости достаточно тексте какому-либо показал, a c экспериментально для список возрастающем списке из и что слова, показал, в встретившихся в список подчиняется в тексте а частоты естественного большому пронумеровать c (ранга) экспериментально частоты большому В году убывания слова, закону: Зипф тексте достаточно пронумеровать данном экспериментально частоты возрастающем всех собрал постоянной.” слова, их к список порядке любого профессор порядкового постоянной.” встречаемости тексте “Если частоты любого что Зипф нем порядке, нем список постоянной.” (ранга) убывания для его материал,

Теория фракталов тесно связана с кластерным анализом, решающим задачу выделения компактных групп объектов с близкими свойствами. Кластеризация сегодня применяется при реферировании больших документальных массивов, определении взаимосвязанных групп документов, для упрощения процесса просмотра при поиске необходимой информации, нахождения уникальных документов из коллекции, выявления дубликатов или близких по содержанию документов.

Фрактальный принцип самоподобия предполагает бесконечное дробление набора объектов с сохранением их свойств. В тематических информационных потоках, например, можно наблюдать подобие сюжетных цепочек, получаемых при уточнении запроса (конечно в определенных рамках). Вместе с тем, сегодня многими исследователями рассматривается не дробление, а естественный рост размеров информационного пространства.


Теория информационного поиска Лекция. Элементы фрактального анализа информационных потоков Дмитрий Ландэ

Персональные инструменты
Инструменты