Обсуждение:История Летописи/Процедура превращения журнала в карту

Материал из Letopisi.Ru — «Время вернуться домой»
Перейти к: навигация, поиск

Содержание

Исходные данные

Как выглядели данные:

rev_timestamp;rev_user_text;rev_page;rev_user;page_title;rev_len
20090416061258;Наталия Ефимова;135741;27831;""Школа_№12,_города_Кунгура,_Пермского_края"";87
20070427072926;Анна Коровко;42443;190;"BOTANICUS"_Малышева_И.В.;102
20090320120452;Рината Рахимзянова;131370;27415;"Jack_London_and_his_creativity";3657
20090320120526;Рината Рахимзянова;131370;27415;"Jack_London_and_his_creativity";3656
20090320120558;Рината Рахимзянова;131370;27415;"Jack_London_and_his_creativity";3655

Данные после сортировки

  • sort1.let <- lhist[order(lhist$rev_timestamp), ] # Отсортировали записи по дате

Получили:

     rev_timestamp     rev_user_text rev_page rev_user       page_title rev_len
759708 20051223042724      OckhamTheFox    96562        0     Мульт_Постер      48
100385 20060127110211 MediaWiki default        1        0 Главная_страница     253
100386 20060127134527             Admin        1        1 Главная_страница     699
100387 20060127134633             Admin        1        1 Главная_страница     703
100388 20060127135228             Admin        1        1 Главная_страница     718
100389 20060127140007 Евгений Патаракин        1        2 Главная_страница     747


Определение узлов-ветеранов

Ветераны - узлы, которые были активны и в прошлые годы

Сколько в 2007 году было ветеранов? - тех, кто уже работал в 2006 году?
length(intersect(users2007,users2006))


Одноразовые узлы

Это узлы, связанные с сетью только одной связью

  • poor.vs<-V(lt2.network)[degree(lt2.network)<2] = 3160
Одноразовые участники - участники, которые совершили только одно действие
length(grep(pattern = "U:", as_ids(poor.vs), value = TRUE)) ; = 250 участников с одноразовым действием
Одноразовые страницы - страницы, в отношении которых было совершено только одно действие (это страницы, которые были созданы, но больше они никогда не изменялись)
length(grep(pattern = "P:", as_ids(poor.vs), value = TRUE)) ; = 2910 страниц - созданных, но не измененных


Удаление бедных страниц

poor_pages06 <- V(lt06.network)[V(lt06.network)$type == 0 & degree(lt06.network)<2 ]

  1. удалили pages c 1 связью и авторов без связей

ltr06.network <- delete.vertices(lt06.network, poor_pages06)

Представление результатов в VOSviewer

Lin/Lon Modularity

Lthist01vw.png

Association strength

Lthist02vw.png


Lthist02vw.png

Фрагмент карты

Lthist03vw.png

Персональные инструменты
Инструменты