POMOCNÝ SOFTWARE NA TVORBU OBRAZOVÝCH DATOVÝCH SAD V DIGITÁLNÍ KNIHOVNĚ S VYUŽITÍM STROJOVÉHO UČENÍ.

Item request has been placed! ×
Item request cannot be made. ×
loading   Processing Request
  • Additional Information
    • Alternate Title:
      ASSISTIVE SOFTWARE FOR THE CREATION OF IMAGE DATASET IN A DIGITAL LIBRARY USING MACHINE LEARNING.
    • Abstract:
      Purpose - This paper describes the possibilities of using assistive software to efficiently create image datasets from digital library documents. The software described, in addition to the usual ways of working with data, uses machine learning features that have the potential to both make the work of annotators easier and to change annotation practices. At the same time, the emphasis is on simplicity and openness of the whole process. The aim is to highlight these elements through practical examples. Design / methodology / approach - After an introductory section, the possibilities for selecting and separating data from digital library documents are presented. At the same time, the limitations of these approaches are pointed out. Based on these insights, possible approaches and the use of assistive software are then explored in order to overcome these limits. The methods are described based on the practical use of the software in the annotation process. The validation of the machine learning features is performed using, among others, the visualization technique Class Activation Mapping and the F-score metric. Results - The described approaches and the use of assistive software with machine learning features proved to be very beneficial. The software not only makes the work of the annotators easier but also considerably faster and more accurate. The versatility of the tested machine learning model also proved to be a great positive, allowing to extend the annotation processes beyond the initially assumed use and thus giving room for further research in this area. Originality / value - The technical paper highlights possible approaches to use assistive software to facilitate the creation of datasets for documents with a limited number of identifiers, such as a digital library, without the need for commercial tools. It also shows practical examples of how machine learning can be used to make these processes more efficient. Examples of how these processes can be used universally are also provided. [ABSTRACT FROM AUTHOR]
    • Abstract:
      Účel - Tento odborný článek popisuje možnosti využití pomocného softwaru za účelem efektivní tvorby obrazových datových sad z dokumentů digitální knihovny. Popisovaný software, kromě běžných způsobů práce s daty, využívá prvky strojového učení, které mají potenciál jak práci anotátorů usnadnit, tak také změnit anotační praktiky. Zároveň je kladen důraz na jednoduchost a otevřenost celého procesu. Cílem je na tyto prvky upozornit pomocí praktických ukázek. Design / metodologie / přístup - Po úvodní části jsou představeny možnosti výběru a separace dat z dokumentů digitální knihovny. Zároveň je poukázáno na limity těchto přístupů. Na základě těchto poznatků jsou poté zkoumány možné přístupy a využití pomocného softwaru za účelem tyto limity překonat. Metody jsou popisovány na základě praktického využití softwaru při anotačním procesu. Validace prvků strojového učení je provedena mimo jiné vizualizační technikou Class Activation Mapping a pomocí metriky F-score. Výsledky - Popisované přístupy a využití pomocného softwaru s prvky strojového učení se ukázalo jako velmi přínosné. Software nejen práci anotátorů ulehčuje, ale zároveň značným způsobem urychluje a zpřesňuje. Za velké pozitivum lze považovat univerzálnost testovaného modelu strojového učení, která umožňuje rozšířit anotační procesy za zprvu předpokládané využití, a dává tedy prostor pro další výzkum v této oblasti. Originalita / hodnota - Odborný článek poukazuje na možné přístupy využití pomocného softwaru, usnadňující tvorbu obrazových datových sad u dokumentů s omezeným množstvím identifikátorů, jako je například digitální knihovna, a to bez potřeby komerčních nástrojů. Dále ukazuje praktické příklady, jak lze pomocí strojového učení tyto procesy zefektivnit. Podstatné jsou také příklady možností univerzálního využití těchto procesů. [ABSTRACT FROM AUTHOR]