Faculty of Informatics and Statistics, Department of Information and Knowledge Engineering (DIKE)

Date and time: December 2 2004 (10:00 – 11:30). Non–standard date or time!

Room: 403 NB

Presentations

Multi–relační mining a asociační pravidla

Speaker

  • Tomáš Karban, MFF, UK Praha

Základním cílem multi–relačního data miningu je dobývání znalostí z více relačně svázaných tabulek, namísto jejich předzpracování do jediné datové matice. Novým přínosem je použití virtuálních atributů odvozených z podřízených tabulek ve formě asociačních pravidel (zpravidla fundované implikace), což nemá ekvivalent v běžných formách předzpracování dat. Problémem je ovšem explozivní nárůst velikosti úloh. Částí příspěvku bude rovněž prezentace práce na přípravě umělých databází pro multi–relační data mining, tedy reverzní postup \"schovávání\" zadaných asociačních pravidel do generovaných dat s danou strukturou.

KL–Collaps module (Nová implementace GUHA procedury COLLAPS)

Speaker

  • Václav Lín, KIZI, VŠE Praha

KL–Collaps is a sub–module of KL–Miner, designed to closely examine the patterns discovered with KL–Miner. KL–Collaps implements a significant part of functionality of GUHA procedure COLLAPS that was designed in late 1970\'s. The procedure takes as input a two–dimensional contingency table, generates \"all interesting\" 2 x 2 tables derivable from the contingency table, and outputs a set of patterns that can be understood as association rules describing \"sources of dependence\", or the strongest interactions, in the input contingency table. This is useful e.g. when we reject the hypothesis of independence (via the Chi^2 test) but dependence between the row and column attribute is hard to understand (think of contingency tables larger than 10 x 10). In this way, KL–Collaps helps the user to gain some additional insight into the results of KL–Miner.

Downloads: slides 1 

Powered by Resource Description Framework (RDF)