Blad strony
The ALERT I

Podstawowe informacje o systemie ACSYS Data & Document Load

ACSYS Data & Document Load (ADDL) jest systemem przeznaczonym do sprawnego wyszukiwania dokumentów na podstawie zawartej w nich treści. Dokumenty poddawane są indeksowaniu, czyli procesowi tworzenia i utrzymywania indeksów umożliwiających znaczące obniżenie czasu wyszukiwania informacji. Dzięki modułowej budowie, system ADDL pozwala na wygodne tworzenie archiwów bibliotek indeksów, ich efektywne przeszukiwanie oraz przenoszenie znalezionych dokumentów do innych systemów zewnętrznych. Komunikację między modułami zapewnia technologia Web Service. System został stworzony z wykorzystaniem silnika wyszukiwania firmy dtSearch Corp. z siedzibą w mieście Bethesda – Maryland.

W zależności od potrzeb można zestawiać różne konfiguracje ADDL, począwszy od minimalnych, w których wszystkie elementy systemu działają na jednej stacji roboczej, do bardzo rozbudowanych, o architekturze klient–serwer, w których poszczególne moduły systemu działają na różnych komputerach. Konfiguracja ADDL w architekturze klient–serwer została rozbudowana o mechanizm przydzielania i kontroli uprawnień użytkowników w procesie wyszukiwania w poszczególnych indeksach.

ADDL jest przeznaczony do wyszukiwania dokumentów pochodzących z różnych źródeł informacji. Mogą to być:

  • • pliki przechowywane w systemie plików. System rozpoznaje ponad 300 formatów plików, w tym:

    • dokumenty pakietów Microsoft Office oraz Open Office
    • dokumenty PDF
    • dokumenty popularnych procesorów tekstowych (WordPerfect, WordStar, Write i inne)
    • pliki poczty elektronicznej (pst, ost, msg, eml)
    • archiwa plików (zip, rar, arj, tar, cab i inne)

  • • strony WWW udostępnione w Internecie,

  • • relacyjne bazy danych (Oracle, SQL Server, Access oraz bazy zgodne ze standardem ODBC lub OLE DB),

  • • serwery poczty elektronicznej.

Otwarta architektura systemu pozwala na łatwą rozbudowę obsługi innych źródeł dokumentów, w zależności od potrzeb klienta.

Dokumenty znajdujące się w zewnętrznych źródłach danych mogą ulegać zmianom. Powstaje wówczas konieczność aktualizacji zawartości indeksów. ADDL zapewnia automatyczne utrzymywanie aktualności indeksów poprzez mechanizm harmonogramu zadań. Harmonogram służy do określania jednorazowego lub cyklicznego wykonywania aktualizacji wskazanych indeksów (np. codziennie po godzinach pracy, pierwszego dnia miesiąca, itp.). Dzięki temu można osiągnąć rozsądny kompromis między nakładami na indeksowanie dokumentów a aktualnością indeksów.

Aplikacja ADDL Klient zapewnia intuicyjne wyszukiwanie w języku naturalnym (zapytanie naturalne) lub z wykorzystaniem rozbudowanej składni (zapytanie strukturalne). Użytkownik ma możliwość wyboru jednego lub wielu indeksów, które będą przeszukiwane. Samo wyszukiwanie wykonywane jest po stronie serwera. Pobrane wyniki prezentowane są w jednolitej formie, uszeregowane według dynamicznie obliczanego rankingu. Dodatkowe funkcjonalności, takie jak linia czasu, filtrowanie czy wyszukiwanie w wynikach, umożliwiają dogłębną analizę zbioru danych w poszukiwaniu pożądanej informacji.

Raz utworzone zapytanie może zostać zapisane w repozytorium zapytań. Użytkownik może w dowolnym momencie pobrać zapytanie z repozytorium w celu ponownego wykonania. Ta funkcjonalność jest szczególnie wygodna w przypadku, gdy indeksy podlegają ciągłej aktualizacji i mogą pojawić się w nich nowe dokumenty spełniające kryteria zapytania.

Treść wyszukanych dokumentów może być zapisana lokalnie na komputerze użytkownika lub bezpośrednio przesłana do systemu zewnętrznego w wymaganym formacie. Dokumenty mogą zostać wyeksportowane w postaci tekstowej lub oryginalnej, pobranej przez serwis indeksujący bezpośrednio z właściwego źródła dokumentów.

W celu precyzyjnego i efektywnego wyszukiwania informacji w języku polskim, kluczowe jest uwzględnienie jego charakterystyki. Dlatego system ADDL uzupełniono o dedykowany moduł językowy, w skład którego wchodzą:

  • • oprogramowanie do obsługi fleksji języka polskiego, stworzone przez wybitnych polskich naukowców językowych,

  • • baza synonimów zawierająca ponad pół miliona haseł,

  • • moduł automatycznego rozpoznawania kodowania dla dokumentów, które nie posiadają informacji o wykorzystanej stronie kodowej,

  • • słownik wyrażeń bliskoznacznych.

Aplikacja ADDL Administrator służy do wygodnego zarządzania systemem. Głównym zadaniem administratora jest tworzenie indeksów i utrzymywanie ich aktualności. Indeksy grupowane są w biblioteki, czyli zbiory powiązanych ze sobą logicznie treści. Użytkownik może mieć dostęp do dowolnej liczby bibliotek zdefiniowanych w systemie ADDL.

Na potrzeby indeksowania relacyjnych baz danych ADDL Administrator został wyposażony w ergonomiczny, graficzny interfejs definiowania kwerend (Active Query Builder). Zapewnia to łatwy sposób tworzenia kwerend bez potrzeby wykorzystywania składni języka SQL.

ADDL Administrator umożliwia ustalanie harmonogramu zadań wykonywanych po stronie serwisu indeksującego oraz diagnostykę procesów systemu ADDL, takich jak bieżące indeksowania, sesje klientów, zajętość zasobów serwera i inne.

Niżej przestawiono schemat logiczny systemu ADDL w wersji do wspomagania procesów analizy kryminalnej (ADDL – Intelligence Find & Extract Option).

W procesie wspomagania analizy kryminalnej ADDL wykorzystuje komponenty programu IBM Analyst’s Notebook do przetworzenia wybranej zawartości dokumentów na diagram. Struktura powiązań i właściwości elementów diagramu są następnie pobierane i zapisywane jako rekordy w analitycznej bazie danych iBase.

Reasumując, ADDL służy do wyszukiwania dokumentów na podstawie zawartej w nich treści, przetwarzania znalezionych informacji do formatu akceptowanego przez zewnętrzny system informatyczny i przesyłania informacji do tego systemu.

   ACSYS BSC Sp. z o.o.: © wszelkie prawa zastrzeżone