У сучасному світі важко знайти…

Користувачам бачити не тільки

У сучасному світі важко знайти об'єкт, що розвивається настільки ж потужними темпами, як Інтернет. Щодня створюється безліч сайтів найрізноманітнішої тематики. Поширеним явищем стала веб студія, яка об'єднує людей, які професійно займаються створенням ресурсів, що розміщуються у всесвітній павутині. За даними американських вчених, вже зараз в Інтернеті знаходиться кілька сотень мільярдів різних документів, причому тільки 0,2% з цього обсягу інформації проіндексовано пошуковими системами. Більшість документів з різних причин не доступні для індексації: зберігання в базах даних, невідповідний формат і т.д. Очевидно, потрібні нові технології пошуку в Інтернеті, що дозволяють користувачам бачити не тільки вершину айсберга. Адже більшості користувачів Інтернету потрібні конкретні дані, а зовсім не краси web-сторінок. Хоча, звичайно, люди — це істоти, які цінують прекрасне, і створення дизайну сайту краще проводити на належному естетичному рівні, інакше ресурс ризикує не отримати відвідувачів.

Видавана при пошуку інформація повинна максимально відповідати запиту користувача. Це нагадує вдалий логотип, який кожному, хто його бачить, дає чітку інформацію про представленої компанії: коротко, ємко, у точній відповідності з характером діяльності. До речі, саме тому створення логотипу неможливо без розуміння специфіки відповідного бізнесу. Очевидно, пошукова система повинна, по-перше, навчитися знаходити документи, розміщені в недосяжних поки глибинах Інтернету, і, по-друге, не просто видавати величезний список відповідних ключовому запиту документів, а повинна надавати більше <интеллектуальный> сервіс. Саме в цих двох напрямки працюють фахівці, що займаються розвитком пошукових технологій.

У компанії IBM розроблено інноваційна технологія, що дозволяє здійснювати пошук документів не за ключовими фразами, а за поняттями. Користувач системи задає тему пошуку і отримує релевантну даній темі інформацію. Технологія заснована на використанні архітектури UIMA, що дозволяє працювати з неструктурованими даними: робити аналіз тексту, наявного в документах, і визначати закладені в ньому поняття майже так, як це робив би людина, що спеціалізується у певній галузі знання. Ця система в даний час використовується для пошуку інформації в локальних корпоративних мережах і може бути поширена для застосування в глобальній мережі.

Проблемами <глубинного> пошуку в Інтернеті зайняті багато вчених. Вже зараз існують досить хороші розробки, наприклад: система Infovell, яку запропонували вчені Каліфорнійського університету; пошукова система, розроблена компанією Glenbrook Networks та інші. Глибинним Інтернетом (deep web) серйозно займаються фахівці компаній Yahoo і Microsoft. Як бачимо, завдання організації ефективного пошуку інформації в глобальній мережі вирішують зовсім не випадкові люди, і результати, швидше за все, не змусять себе довго чекати.

Свежие записи

Комментирование закрыто.

Страница 1 из 11