Architektura informacji AD 2010

Poniższa publikacja jest związana z Pierwszym zjazdem architektów informacji Polish IA Summit, który to zjazd jest wspierany przez autora niniejszego blogu.

iasummitwarsaw.pl logotypZacznijmy od odrobiny teorii. W czasach blogosfery nikogo chyba przekonywać nie trzeba o rosnących trudnościach w docieraniu do treści. Lawinowy przyrost informacji, rozpoczęty w XX wieku proporcjonalnie zwiększył potrzebę organizowania – klasyfikowania, nadawania odpowiednich etykiet. Peter Morville, autor obowiązkowej lektury Information Architecture for the World Wide Web, podaje kilka powodów, dla których organizacja nie jest prosta, wśród których wymienia niejednorodność.

O co chodzi? Otóż klasyczne katalogi biblioteczne zawierały zawsze ten sam, homogeniczny zestaw metadanych dla każdej pozycji – autor, tytuł, temat, data wydania, etc. Za pośrednictwem karty katalogowej nie ma możliwości uzyskania dostępu do treści wolumenu. W internecie metainformacje nie są już oddzielone od opisywanej informacji. W efekcie gromadzimy więc w jednym worku zarówno treść, jak i metadane, które w założeniu pomagać nam mają w odnajdywaniu interesujących nas kwestii. Oczywiście paradoksalnie powiększa to cały bałagan, choć w założeniu chodzi o uporządkowanie.

W jaki sposób wykorzystuje się metadane (zobacz także zestawienie Dublin Core Metadata Element Set)? Opisanie treści we właściwy sposób pozwala na właściwe klasyfikowanie dokumentu. Dzięki odpowiedniemu oprogramowaniu, obsługującemu tzw. słowniki kontrolowane i tezaurusy, w tej samej kategorii serwisu www odnajdziemy odnośniki do zbliżonych znaczeniowo tekstów. Znacznie ciekawsze jednak mogą być aplikacje nietypowych systemów klasyfikacyjnych, opartych na analizie znaczeń publikowanych w internecie treści. Zanim jednak do tego przejdziemy, jeszcze dwa słowa o „tradycyjnych” sposobach organizacji informacji.

Architektura informacji w Sieci

W jaki sposób zatem organizuje się informacje w sieci WWW? Każda organizacja wymaga jakiegoś klucza, wedle którego poukładamy treści. Może to być klucz:

  • alfabetyczny,
  • chronologiczny,
  • geograficzny,
  • tematyczny (prawdopodobnie najbardziej rozpowszechniony),
  • zadaniowy,
  • audytorium (do kogo skierowana jest informacja?),
  • metaforyczny,
  • hybrydowy, łączący kilka kryteriów.

Rozwój serwisów społecznościowych dodał do powyższej listy kategoryzację folksonomiczną, znaną szerzej jako tagi. Z ciekawszych koncepcji warto wymienić także tak zwaną nawigację fasetową, zwaną gdzieniegdzie dynamiczną taksonomią. Umożliwia ona łączenie wielu kluczy przeglądania/wyszukiwania w celu zawężenia wyświetlanych wyników

demo nawigacji fasetowej w serwisie elastic lists

Ilustracja: bardzo ciekawe demo nawigacji fasetowej pod nazwą elastic lists z serwisu well formed data.

Zorganizowana informacja wymaga odpowiedniej prezentacji, umożliwiającej użytkownikom poruszanie się po strukturze. Prezentację stanowi warstwa nawigacji – widoczne dla internautów systemy przeglądania treści. Poza systemami nawigacji serwisów internetowych, mamy dodatkowo do dyspozycji wbudowane mechanizmy przeglądarek, w teorii ułatwiające poruszanie się po przeglądanych treściach.

zrzut ekranu: przykład źle konfliktu ze źle zaprojektowaną nawigacją serwisu

W teorii, ponieważ wszyscy znamy efekty konfliktu pomiędzy nieumiejętnie skonstruowaną nawigacją serwisu, a intuicyjnie naciśniętym przyciskiemwstecz w przeglądarce.

W poszukiwaniu sensu, czyli Semantyczna Sieć raz jeszcze

Od klasyfikacji informacji ciekawsze mogą być algorytmy umożliwiające analizę samego znaczenia treści. Systemy typu data-mining czy też content intelligence mogą mieć kilka zastosowań w internecie - od nawigacji opartych na opiniach użytkowników, po aplikacje wspomagające decyzje biznesowe.

Data mining nabiera być może szczególnego znaczenia w czasach masowych publikacji przez miliony pojedynczych użytkowników internetu. Pozwala bowiem na syntezę informacji z wielu rozproszonych źródeł, niemożliwych do przetworzenia w rozsądnym czasie przez człowieka. Najogólniej rzecz ujmując, taka semantyczna analiza treści polegać może na:

  • dopasowaniu poszukiwanych wzorców – polegającym na zliczaniu odpowiednich określeń w analizowanych tekstach,
  • badaniu lingwistycznym struktury wypowiedzi – opierającym się m.in. na słownikach kontrolowanych z analizowanej dziedziny.

Zautomatyzowane przetwarzanie treści internetu pozwala chociażby poznać opinie klientów na temat marki i produktów firmy oraz jej konkurentów – wykorzystując tzw. sentiment analysis. Możliwe jest badanie wpływu komunikacji marketingowej na odbiorców – przeprowadzone chociażby na forach konsumentów, niekoniecznie powiązanych z zainteresowaną marką. Także za pomocą tej techniki na zlecenie Cisco wykonano analizę korelacji pomiędzy wypowiedziami zarządu a kursem akcji, co pozwoliło wyodrębnić osoby o największym pozytywnym wpływie.

Określenie data mining związane jest z pojęciem sieci semantycznej. Niewielu internautów pamięta zapewne hasło semantic web z początku tego wieku. Na długo przed Facebookiem pojęcie Web 2.0 oznaczać miało właśnie pomysł semantycznej sieci – odpowiedź na rosnący chaos informacyjny. W nowym internecie treści miały łączyć się nie za pomocą dosyć przypadkowych (jak obecnie) hiperłączy, lecz poprzez połączenia znaczeniowe, semantyczne.

Poniżej na poły żartobliwe wyjaśnienie, czym ma być Sieć semantyczna.

Na obecnym etapie rozwoju internetu zbudowanie bazy wiedzy opartej o relacje semantyczne wymaga stosowania wyspecjalizowanego oprogramowania, wykonującego właśnie data mining ogólnodostępnych w internecie źródeł.

Internet opinii

Co to wnosi dla przeciętnego zjadacza internetu? Na powszechne potrzeby powstają tymczasem niezbyt zaawansowane aplikacje dokonujące statystycznej analizy publikowanych informacji.

zrzut ekranu - statystyki opinii na twitrratr

Ilustracja: statystyki opinii o Apple iPad, prezentowane przez twitrratr.com na podstawie analizy statystycznej treści mikroblogu Twitter.

W chwili obecnej zasięgnięcie opinii na temat interesującego nas produktu wymaga mozolnego, ręcznego wyszukiwania po rozlicznych serwisach. W zasadzie niemożliwe jest sięgnięcie do większej liczby źródeł, porównanie kilku produktów i dokonanie syntezy informacji na własną rękę. Pracę tę jest w stanie wykonać za użytkownika właśnie aplikacja stosująca sentiment analysis. Jej zaletą, poza zdolnością do przetwarzania znaczącej ilości informacji jest także wykrywanie spamu, w tym przypadku oznaczającego fałszywe opinie – dodawane w celu wypromowania danego produktu.

Więcej…

logotyp Uselab…na temat warstwy nawigacji w Sieci dowiecie się z prezentacji Jamesa Kalbacha podczas zorganizowanego przez UseLab Polish IA Summit, na którą to prezentację osobiście czekam i w imieniu organizatorów serdecznie zapraszam. Ruszyła już sprzedaż biletów, zachęcam do śledzenia mojego blogu – niebawem do wygrania wejściówka.

15 responses to “Architektura informacji AD 2010”

  1. Ewa

    Folksonomia to relacje pomiędzy poszczególnymi tagami. Tak też folksonomia to zbiór tagów, który wchodzi w relacje między sobą. Relacje tworzą użytkownicy, którzy oznaczają dane informacje poszczególnymi tagami.

    Oznacza to, że to nie folksonomia jest zwana tagami a tagi folksonomią :) Nie jest również wyłącznie widoczna w serwisach społecznośiowych – bo każdy autor bloga wykorzystujący tagi również ją tworzy.

  2. Marek Kasperski

    Bardzo dobry wpis, jednak: „W jaki sposób zatem organizuje się informacje w sieci WWW? Każda organizacja wymaga jakiegoś klucza, wedle którego poukładamy treści. Może to być klucz: (…)”. Jest jeszcze jeden – cenowy.

  3. eryk orłowski

    dzięki Marek :) Pewnie to też nie wyczerpuje listy, samą tę listę sposobów klasyfikacji możnaby długo omawiać pewnie, ale nie chciałem przepisywać Morville’a ;) IMHO fajniejsze są te lingwistyczne zabawy z content extraction, content mining i oparta na nich warstwa nawigacyjna – mam nadzieję, że Kalbach coś o tym powie…

  4. eryk orłowski

    @Ewa – racja, to w sumie za duży skrót myślowy – już prędzej powinno być zapewne nawigacja folksonomiczna niż folksonomia.

    Folksonomia to oczywiście system klasyfikacji, a nie same tagi. Co też oznacza, że tagi to nie folksonomia, swoją drogą ;)

  5. Marek Kasperski

    @Ewa: ciekawe czy blogi nie są specyficzną odmianą serwisów społecznościowych – tworzą sieć (przez blogroll), w tym niebanalną sieć społeczną (przez blogroll) – stąd kilka mikroformatów powstało dla ukazania tych relacji na poziomie logicznym.

  6. Ewa

    @Eryk – folksonomie to nie klasyfikacje – bliżej im do kategoryzacji, choć sama nazwa jest też nienajlepsza bo to żadna -nomia.

    A teraz kawałek tekstu z mojej pracy ;)

    Folksonomie bowiem nie mają żadnych relacji z taksonomiami lecz ze zbiorem niekontrolowanych słów kluczowych (tagów) bez żadnej hierarchii.
    Folksonomie są rezultatem tagowania informacji i obiektów przez użytkowników w Internecie. Owe tagowanie może się odbywać w przestrzeni danej społeczności internetowej skupiającej się wokół określonego tematu lub też na własny użytek. Tagowanie polega na przypisywaniu słów kluczowych najlepiej określających daną informację.
    Folksonomie są wynikiem powiązań pomiędzy poszczególnymi tagami określającymi dane informacje. Ważnym aspektem jest tutaj kwestia płaskiej organizacji tagów. Jedynym elementem spajającym dane tagi jest ich występowanie przy konkretnej informacji.

    itp. itd :)

  7. Ewa

    @Marek no pewnie jesli autor bloga wykorzystuje do jego promocji systemy skupiajace tagi np. tagi podpiete pod technorati lub inny system to jak najbardziej mozmy mowic o jakims tam uczestnictwie w spolecznosci blogerskiej, jednakze pisalam raczej o czestszej sytuacji gdy autorzy wykorzystuja tagi do wewnetrznej organizacji tresci i relacje pomiedzy poszczegolnymi elementami powstaja na poziomie bloga a nie innych blogow.

  8. eryk orłowski

    moment, jakże nie klasyfikacja? Przecież tworzymy zbiory elementów, przypisanych do danego tagu. Co to jest, jeżeli nie klasyfikacja?

    Może nie chodzi o to, że tagowanie ma na celu utworzenie klasyfikacji, w efekcie jednak taka klasyfikacja się tworzy…

  9. Ewa

    @Eryk –

    klasyfikacja [łac. classis ‘oddział’, facio ‘czynię’], systematyczny podział przedmiotów (zjawisk) na klasy, działy i poddziały, dokonywany wg określonej zasady.

    Folksonomia jak pisałam nie ma żadnych zasad. Zależy wyłącznie od ludzi którzy oznaczają dane informacje tagami.

  10. eryk orłowski

    definicję znam moja droga ;)

    Wiem nawet, z którego dokumentu pochodzi stwierdzenie o różnicy pomiędzy kategoryzacją, a klasyfikacją ;)

    Owszem, brak typowej hierarchii taksonomicznej i nie ma możliwości przestrzegania rygorystycznych reguł w kwestii relacji pomiędzy pojęciami. Niejmniej jednak przyjęło się określanie folksonomii mianem klasyfikacji, więc nie bądźmy świętsi od papieża :P

  11. Ewa

    @Eryk definicja jest kluczowa :P i szczerze mówiąc nie wiem kto przyjął i gdzie ale ja raczej spotkałam się z tym aby unikać określania folksonomii klasyfikacja bo po prostu nią nie jest.

  12. eryk orłowski

    Myślę, że najlepiej odniósł się do tego wieki temu sam twórca pojęcia. Nie przeczy to Twoim wypowiedziom, to proste stwierdzenie faktu rozpowszechnienia się pewnej terminologii.

    http://www.vanderwal.net/random/entrysel.php?blog=1750

  13. Alfred

    to tak jak z ekologią, zgadzam się z Erykiem

  14. IA Summit w Warszawie – już w kwietniu : WebAudit Blog

    [...] wprowadzający o architekturze informacji, u Eryka [...]

  15. Polish IA Summit - WebFan

    [...] wprowadzający o architekturze informacji, u Eryka [...]

Leave a Reply