77279

TAG CLOUD FOR THE INFORMATION DATA FILTRATION

Научная статья

Информатика, кибернетика и программирование

The ppliction of the theory of rough sets is considered to solve the problems of visuliztion nd processing of dt. The theory of rough sets cn be considered to be one of the wys of developing the Freges ide of uncertinty. In this pproch uncertinty is defined through the boundry of set. If our knowledge is not enough for strict definition of set then its boundry is not null otherwise the set is stndrd.

Английский

2015-02-02

27.5 KB

0 чел.

TAG CLOUD FOR THE INFORMATION DATA FILTRATION

D.V. Manakov, R.O. Sudarikov

IMM UrB RAS, UrFU, Ekaterinburg

The parallel filtration of the data together with parallel rendering is widely applied to reduce volume of the visualized data.

The question of efficiency is the key question for parallel computing. The essence of the matter is when you should use parallel rendering or filtration of data for the best results in case of visualization large amounts of data. Raster data is generated as the result of rendering, thus reducing the available methods of interaction with visualized objects. Decreasing the amount of data helps to speed up the interaction with computational model.

A quick selection of information of interest is the key feature of the filtration. One can use different methods to solve this problem, for example, data restructuring with k-trees and item processing in data flow model. Obviously, it is easy to use hashes in a software implementation.

A context tag cloud, the metaphor of visualization and interaction, is proposed as a solution of that problem in this work. A context tag cloud designed for efficient interpretation of the search results in the Internet. Interaction between selected and filtered data is implemented through the hashes.

The correct solution of the efficiency problem can only be based on a formal model. “It is nearly impossible to show the fundamental laws or variational principles of an object in order to create its model. One of the most useful approaches for such an object is applying the analogs of studied objects.” [1]

Visualization as an object of study is poorly formalized, but one can declare a semi-model or a base for visualization theory for creation of the assessment of efficiency needed. The declaration can be started with the definitions and analogs searching.

Optimal control can be one of such analogs. Thus filtration can be defined as an interactional process, which aim is to show maximum data with minimal costs. In general case, filtration would be a solution for the problem of getting minimum of the cognitive distance, which shows users efforts to convert the amount of actions to input data and its visualization into the operations and objects of application area. MapReduce algorithm is used for the search. If type of mapping is chosen in the same way, then the cognitive distance will possibly decrease.

The application of topological analysis to visualization is demonstrated in the work [Choudhury], where the trace of program is mapped with a cloud of points.

The application of the theory of rough sets is considered to solve the problems of visualization and processing of data. The theory of rough sets can be considered to be one of the ways of developing the Freges idea of uncertainty. In this approach uncertainty is defined through the boundary of a set. If our knowledge is not enough for a strict definition of a set, then its boundary is not null, otherwise the set is standard. A boundary as a topological concept is the difference between the closure and the interior of a set. Granularity is also a key concept of this theory. A set is defined as a aggregation of elementary items, for example, in the visualization they are the graphic primitives.

Declaration of membership function for a set can be considered as a method of ordering of that set. The parallel with hashes seems to be obvious. The discussion of a rough sets membership function as a metric of assessment of efficiency seems to be of a great interest. A rough set X can be considered to have a membership function X(x)[0,1] for each of its items. This function defines the probability of membership instead of classical theory where elements is strictly a member of a set or not. Tag cloud can be considered as a set of words, ordered with the membership function, with computed frequency features.

The problem of the algorithm definition is equivalent to the problem of computable function. The theorem of equivalence computable function and membership function can be formulated.

Metaphor of context tag cloud expands the standard tag cloud by defining several membership functions for the search results set. Rough set X, which contains the search results, can be represented as an array of hashes, where the central element of that array is the search string. Two membership functions are declared: the width of a context, which shows the amount of words displayed on the right and on the left from search string, and frequency of occurrence of the word, depends on the document type(doc, pdf or html) and shown with RGB-color gradation. The search results also includes title and hyperlink of the document, which can be marked out through the interaction with particular word (a key).

The program is implemented with Ruby and its architecture corresponds to the Cloud Computing. The program intermediary (proxy) get search results through Google API and restructures data to hashes. The interaction on the client is based on that hashes, thus the amount of re-computing actions is reduced to minimum. The next step of this work is the integration of the implemented system with Hadoop distributed computing system.

Literature

1. Samarskiy A.A., Mihajlov A.P.mathematical modeling: Ideas. Methods. Examples. – М. PhysMathGiz. 1993 (in Rusian)/

2. Choudhury, A.N.M.I.; Bei Wang; Rosen, P.; Pascucci, V. Topological analysis and visualization of cyclical behavior in memory reference traces // Pacific Visualization Symposium (PacificVis), 2012 IEEE,vol., no., pp.9-16, Feb. 28 2012-March 2 2012.


 

А также другие работы, которые могут Вас заинтересовать

23533. НЕМЕЦКО-РУССКИЙ ФРАЗЕОЛОГИЧЕСКИЙ СЛОВАРЬ 181 KB
  Фразеологизмы компоненты которых в качестве лексем являются грамматическими омонимами также разрабатываются в отдельных гнездах причем при вокабуле дается на это указание: ALTE der die ALTE das Указание на часть речи дается также при вокабулах имеющих омографическое начертание в связи с выделением их прописным шрифтом: LEBEN v . Расположение фразеологизмов в словаре а При наличии в компонентном составе одного существительного искать фразеологизм нужно под ним: großer Bahnhof под Bahnhof jn mit anderen Augen ansehen под Augen...
23534. Турецкий язык за 12 уроков 706.5 KB
  Начальный курс турецкого языка, разработан на основе пособия “Mehmet Hengirmen, 30 Derste Türkçe” для школы иностранных языков. В турецком все читается, как пишется, за исключением одной нечитаемой буквы. Имеет 8 гласных. Непривычных букв всего несколько:
23535. Турецкий язык за 30 уроков 765 KB
  Урок 1 Здравствуйте Ольга: Merhaba Здравствуйте Эрол: Merhaba Здравствуйте Ольга: Adınız ne Как вас зовут имя Ваше как Эрол: Adım Erol. Ольга: Nasılsınız Как поживаете как вы Эрол: Teşekkür ederim iyiyim. А у вас как дела Ольга: Teşekkür ederim ben de iyiyim. 1В Знакомство Ольга: Adınız ne Как вас зовут Эрол: Adım Erol.
23536. УЧЕБНИК ТУРЕЦКОГО ЯЗЫКА 3.45 MB
  18 Гласный а 18 Гласный ı 18 Согласные l m n s 18 Согласные b d r 18 УПРАЖНЕНИЯ 19 Гласный i 19 Гласный e 19 О СМЯГЧЕНИИ СОГЛАСНЫХ unsuz yumuşaması 20 УПРАЖНЬНИЯ 20 СЛОВАРЬ 22 НЕОПРЕДЕЛЕННЫЙ АРТИКЛЬ 23 ПРИНЦИП НЕБНОГО ПРИТЯЖЕНИЯ 24 АФФИКС МНОЖЕСТВЕННОГО ЧИСЛА çoğul eki 24 УПРАЖНЕНИЯ 25 ОПРЕДЕЛИТЕЛЬНАЯ ГРУППА belirtme grupu 25 УПРАЖНЕНИЯ 16 АФФИКСЫ ПРИНАДЛЕЖНОСТИ iyelik ekleri 27 Аффикс принадлежности 1го лица единственного числа birinci kişi tekil iyelik eki 27Аффикс принадлежнocmu 2го лица единственного...
23537. ГРАММАТИКА ШВЕДСКОГО ЯЗЫКА 401 KB
  Неопределённый артикль который ставится перед существительным для общего рода en а для среднего рода ett например: en flicka девочка en dag день ett hus дом ett regn дождь. Это происходит по схеме: существительное неопределённый артикль en ett например: Dag en – dagen hus ett – huset. Определённый артикль среднего рода с существительными на согласный имеет вид –et а на безударный гласный –t например: hus – huset öga – ögat глаз. например: den långa dagen – долгий день det långa borget – длинный стол de långa...
23538. ЭКСПРЕСС–КУРС ЯПОНСКОГО ЯЗЫКА 678.5 KB
  Перед тем, как приступить непосредственно к урокам, необходимо овладеть каной. Кана – слоговая азбука, возникшая в VII в. нашей эры в результате графического сокращения и преобразования китайских иероглифов в знаки алфавита. Существует два вида каны – хирагана и катакана. Хирагана предназначена для записи собственно японских слов и китаизмов
23539. Учебник языка эсперанто 888 KB
  В отличие от русского языка в настоящем времени глаголсвязка estas 'есть' 'является' 'имеется' 'находится' от глагола esti 'быть' не опускается: Nia celo estas demokratio. Marso estas planedo. Формы множественного числа слов оканчивающихся на o или a образуются прибавлением окончания j: novaj frazoj; niaj geografiaj kartoj; Vi estas juna 'Ты молод'; Vi estas junaj 'Вы молоды'. Глагол havi всегда требует винительного падежа глагол esti – никогда; Li havas elegantan palton; Lia palto estas eleganta.
23540. ГРАММАТИКА ИСПАНСКОГО ЯЗЫКА 1.02 MB
  1 Имя существительное – Nombre sustantivo В испанском языке существительные бывают: собственные Rosa Роза Carmen Кармен нарицательные la mesa стол el árbol дерево одушевленные el hombre мужчина el gato кот неодушевленные el bosque лес la silla стул конкретные la cara лицо el techo потолок абстрактные el tiempo время el aire воздух собирательные la biblioteca библиотека la muchedumbre толпа 1. Существительные которые оканчиваются в единственном числе на согласные z и x меняют их во множественном числе на c:...
23541. НЕМЕЦКИЙ ЯЗЫК. УНИВЕРСАЛЬНЫЙ СПРАВОЧНИК 3.34 MB
  2] К ЧИТАТЕЛЮ [1] Язык DIE SPRACHE [1. Die Anwendung des Zeitwortes [2.2] Префиксы die Vorsilben er ent ver.3] Никаких сложносоставных существительных die Substantivkopellungen.