Next Previous Contents

3. Hlavní menu

Tato kapitola popisuje postupně všechny položky menu. V textu je používáno označení ->Menu->Položka pro položku Položka z menu Menu.

3.1 Manažer

Připojení

Provede připojení na server. Bez připojení nelze provádět žádné operace s korpusy. Je možné se připojit buď na vzdálený server pomocí Internetu/intranetu, nebo spustit server lokálně. Pokud je v konfiguraci nastaveno spuštění serveru lokálně, provede se po startu Bonita automaticky připojení. V opačném případě se automaticky vybere tato položka menu a v následně zobrazeném okně je nutné zadat jméno a heslo uživatele.

Připojit přes internet

Připojení se provede na vzdálený server, jehož adresa je ve vstupním řádku Adresa serveru, s použitím zadaného jména a hesla.

Spustit lokálně

Server se spustí lokálně, tedy na stejném počítači, na kterém běží Bonito. V tomto případě musí být celý manažer i se všemi použitými korpusy nainstalován na daném počítači. Jméno a heslo uživatele je ignorováno a přístup ke zvoleným korpusům je dán přístupovými právy k datovým souborům jednotlivých korpusů. Pro spuštění serveru se použije příkaz ve vstupním řádku Příkaz serveru.

Adresa serveru:

Adresa počítače, na kterém server běží, například aurora.fi.muni.cz.

Uživatel, Heslo:

Jméno (login) a heslo uživatele pro přístup ke Bonito (může se lišit od jména i/nebo hesla pro běžný přístup) na daném serveru. Text hesla se ve vstupním řádku nezobrazuje.

Příkaz serveru:

Příkaz, kterým se provede spuštění serveru (například: manateesrv "desam susanne" 2>errlog).

Změna hesla

Změna hesla pro přístup ke Bonito. Je nutné zadat současné (původní) heslo a dvakrát heslo nové. Text žádného z hesel se ve vstupních řádcích nezobrazuje.

Obnovení výsledku

Provede opětovné zobrazení řádků výsledku (podle zadání v ->Zobrazení->Rozsah).

Nastavení

Umožní nastavit různé uživatelské volby aplikace, případně uložit volby pro příští spuštění. Implicitní hodnoty voleb jsou nastaveny tak, aby vyhovovaly většině uživatelů. Pokročilí uživatelé mohou měnit tyto volby:

Tlačítkem Použít se nastavené hodnoty uchovají pouze do ukončení aplikace. Tlačítkem Uložit se hodnoty navíc uloží do konfiguračního souboru a budou použity i při dalším spuštění aplikace. Některé hodnoty (Počáteční ...) mají smysl pouze pro uložení.

Změna jazyka

Volba jazyka uživatelského rozhraní. Zvolený jazyk bude použit i při příštím spuštění programu.

Konec

Ukončení aplikace.

3.2 Korpus

Souhrnné informace

Zobrazí souhrnné informace o vybraném korpusu: jeho jméno a případná dodatečná informace o korpusu z jeho konfiguračního souboru, velikost (celkový počet pozic), poziční atributy a strukturní značky. Pro každý poziční atribut je zobrazen počet různých prvků ve slovníku daného atributu (dle atributu tedy počet různých slov, základních tvarů, značek atd.). Pro každou strukturní značku je zobrazen její celkový počet výskytů v korpusu.

Statistiky

Pro zadané hodnoty atributů vypočte a zobrazí četnosti hodnot v celém korpusu, četnost bigramu v korpusu, množství vzájemné informace (MI-score) a T-score.

Bigramy se hledají s použitím zadaného okna. Implicitní hodnoty od 1 do 1 znamenají, že má druhé slovo přímo následovat první slovo. Od 1 do 5 znamená velikost okna 5, tedy mezi prvním a druhým slovem mohou být až 4 jiné pozice. Záporná znaménka znamenají opačné pořadí výskytu. Od -1 do -1 tedy znamená, že druhé slovo má přímo předcházet první slovo. Od -5 do 5 potom znamená, že slova mají být od sebe vzdálená maximálně 5 pozic a mohou být v libovolném pořadí.

Vytvoření subkorpusu

Ze zvoleného korpusu vytvoří subkorpus podle zadaných podmínek. Subkorpus je možné použít pouze pro hledání. Pro výpočet všech statistik se používá vždy celý korpus.

Základní korpus:

Jméno korpusu, ze kterého se bude subkorpus vytvářet. Jedná se o aktuální korpus z hlavního okna aplikace.

Jméno subkorpusu:

Po úspěšném vytvoření subkorpusu se v seznamu korpusů objeví nový korpusu ve tvaru základní korpus:jméno subkorpusu. Pokud například vytvoříme subkorpus se jménem press z korpusu susanne v seznamu korpusů bude susanne:press.

Značka:

Jméno značky (strukturního atributu), podle které se má subkorpus vytvářet. V subkorpusu budou potom všechny pozice, které jsou součástí značky vyhovující zadané podmínce. Většinou se tvoří subkorpusy podle značky nejvyšší úrovně, které odpovídají jednotlivým dokumentům či textům korpusu.

Podmínka:

Podmínka omezující některé atributy zadané značky. Například v korpusu Susanne jsou tiskové zprávy v dokumentech, jejichž jména začínají na A. Dokumentům odpovídá značka <doc>, jména dokumentů jsou v atributu file. Pro vytvoření subkorpusu tiskových zpráv z korpusu Susanne tedy zapíšeme podmínku:


file = "A.."

Smazání subkorpusu

Zobrazí aktuální seznam subkorpusů, ze kterého je možné zvolené subkorpusy mazat.

Seznam slov

Zobrazí všechny slova ze slovníku zadaného atributu, která vyhovují danému vzoru.

Implicitní atribut

Umožňuje změnit implicitní atribut, podle kterého se provádí vyhodnocování dotazů bez zadaného jména atributu.

3.3 Dotaz

Vyhodnocení

Provede vyhodnocení dotazu (resp. P filtru, N filtru nebo kolokace). Vyhodnocení probíhá na serveru, Bonito pouze čeká na předání výsledku. Operaci lze zastavit pomocí tlačítka Stop, které se aktivací funkce zobrazí vpravo od jména korpusu.

Seznam pojmenovaných dotazů

Zobrazí seznam pojmenovaných dotazů, ze kterého je možné vybrat dotaz pro vyhodnocení, popř. smazat některý dotaz z tohoto seznamu.

Seznam předloh

Zobrazí seznam předloh (viz kapitola 4. Předlohy), ze kterého lze vybrat předlohu pro vyhodnocení, smazat některou předlohu z tohoto seznamu, přidat novou předlohu, popř. změnit text nebo popis vybrané předlohy.

Grafické vytváření

Zobrazí okno, ve kterém je možné vytvářet dotaz pomocí grafických prvků.

Vytvoření předlohy

Přidá do seznamu předloh novou předlohu.

Jméno:

jméno předlohy, které se potom bude používat v dotazech

Předloha:

vlastní text předlohy

Popis:

volitelný popis předlohy

Import předloh

Po zvolení souboru s předlohami (například od jiného uživatele) přidá nové předlohy do seznamu předloh. Soubory s předlohami mají koncovku tpl.

Import pojmenovaných dotazů

Po zvolení souboru s dotazy (například od jiného uživatele) přidá nové dotazy k pojmenovaným dotazům. Soubory s dotazy mají koncovku qry. Importovat je možné i soubor s historií (history.qry), ze kterého se vyberou pouze pojmenované dotazy.

3.4 Konkordance

Souhrn

Zobrazí souhrnné informace o konkordanci: jméno korpusu, velikost konkordance a seznam jednotlivých operací (počínaje dotazem), které vedly k vytvoření konkordance.

Uložení

Uloží zvolené řádky konkordančního seznamu do souboru.

Kódování:

výběr kódování znaků uložených řádků (hodnota `-' znamená kódování, ve kterém je korpus uložen na serveru)

Hlavička:

výběr formátu hlavičky pro uložení informací o dotazu

zobrazené řádky:

uloží pouze aktuálně zobrazené řádky

všechny řádky:

uloží všechny řádky konkordančního seznamu

číslovat řádky:

při zaškrtnutí budou ve výstupním souboru jednotlivé řádky očíslovány

zarovnat KWIC:

při zaškrtnutí budou klíčová slova zarovnány pod sebou

Tlačítkem Kontext je možné změnit kontext pro uložení, který je implicitně stejný s kontextem pro zobrazování (viz ->Zobrazení->Kontext). Po stlačení tlačítka Uložit je nutné zadat nebo vybrat jméno souboru, do kterého se má konkordanční seznam uložit.

Tisk

Vytiskne zvolené řádky konkordančního seznamu na tiskárně, zadávají se stejné informace jako pro ->Konkordance->Uložení.

Smazání vybraných

Smaže označené řádky konkordančního seznamu (viz menu ->Výběr). Počet vybraných řádků je zobrazen ve stavovém řádku u spodního okraje hlavního okna. V závislosti na aktuálním rozsahu zobrazených řádků některé vybrané řádky nemusí být právě zobrazeny.

Redukce

Redukce počtu řádků konkordančního seznamu. Zadává se, které řádky mají ve výsledku zůstat a kolik řádků, procent či setin procenta z původního počtu řádků má zůstat.

Jednoduché třídění

Setřídí konkordanční seznam podle zadaných kritérií.

Počet tříděných pozic:

počet pozic, podle kterých se bude třídit

Třídit:

Udává, které pozice z řádku se budou při třídění porovnávat. V následujícím schématu předpokládáme Počet tříděných pozic = 3. Číslo 1 znamená nejvýznamnější pozici (bude se podle ní třídit nejdříve), číslo 3 nejméně významnou pozici (bude se podle ní třídit až nakonec).

                        ........ <KWIC KWIC> ............
        levý kontext       3 2 1 <         >
        KWIC odleva              <1 2 3    >
        KWIC odprava             <    3 2 1>
        pravý kontext            <         > 1 2 3

Ignorovat velikost:

Při třídění nebude záležet na velikosti písmen.

Retrográdně:

Jednotlivá slova se budou třídit od posledního písmene k prvnímu.

Atribut:

Podle kterého pozičního atributu se má třídění provádět -- výběr z možných pozičních atributů daného korpusu.

Obecné třídění

Setřídí konkordanční seznam podle seznamu třídicích podmínek. Každá třídicí podmínka určuje jednu pozici, podle které se budou jednotlivé řádky porovnávat.

Vynechat duplicity:

Pokud je zatrženo, ze všech řádků, které se shodují ve všech třídicích intervalech, se ve výsledku ponechá pouze jeden.

Přidat:

přidá další třídicí podmínku

Smazat:

smaže vybraný interval (výběr se provádí kliknutím myší)

Budiž:

provede třídění

Zavřít:

zavře okno bez jakéhokoli třídění

Každá třídicí podmínka obsahuje:

Třídit pozici:

číslo pozice, která se bude porovnávat. Opět záporná čísla znamenají pozice před, kladná znamenají za zvoleným počátkem.

od:

udává počátek počítání pozic stejně jako při zadávání filtrů nebo kolokací (viz kap. 3. Tvorba dotazu).

Jméno tříděného atributu

z výběru pozičních atributů korpusu

AaAa:

ignorovat velikost písmen

udazdO:

Odzadu -- třídit retrográdně

Četnostní třídění

Provede třídění podle průměrné četnosti slov z zadaném kontextu. Na prvních řádcích konkordance jsou po třídění kontexty obsahující nejčastější slova.

Třídění podle skupin

Seskupí řádky podle přiřazených čísel skupin. Jednotlivé skupiny budou setříděny vzestupně (první bude skupina číslo 1), na konci konkordance budou řádky, kterým nebyla žádná skupina přiřazena.

Zpět k předchozí

Provede návrat k předchozí konkordanci a zobrazí ji. Touto operací lze zrušit provedené změny v konkordanci (redukce, mazání, použití filtrů) nebo provedené třídění. Funkci je možné použít opakovaně, maximální počet uchovaných konkordancí lze měnit v ->Manažer->Nastavení, implicitně je 5.

Vpřed k následující

Zopakuje operaci, která byla zrušena akcí Zpět k předchozí.

Pojmenovat

Pojmenuje zobrazenou konkordanci. Pojmenované konkordance jsou přímo dostupné v menu ->Konkordance->Pojmenované.

Pokud potřebujeme pracovat opakovaně s výsledkem jediného dotazu, pojmenujeme si výslednou konkordanci a můžeme se k ní kdykoliv rychle vrátit, aniž by se musel znovu vyhodnocovat dotaz.

Smazání pojmenovaných

Slouží k zrušení některých pojmenovaných konkordancí. Zobrazí se seznam všech pojmenovaných konkordancí. Výběrem ze seznamu a stlačením tlačítka Smazat se zvolená konkordance zruší.

Konkordance -> Statistiky

Frekvenční distribuce

Spočítá četnosti slov nebo jiných atributů nebo jejich posloupností na zadaných pozicích.

Limit:

Do výsledku se budou počítat a zobrazovat pouze posloupnosti s četností vyšší než je zadaný limit. Implicitní limit 0 znamená, že se budou počítat všechny hodnoty. Pro konkordanční seznam s velkým počtem řádků to může znamenat velké množství předávaných dat ze serveru a následné náročné třídění výsledku.

Pokud se má zobrazit více řádků (konkrétní číslo závisí na výkonu počítače, běžně více než několik tisíc) může jejich zobrazení trvat příliš dlouho.

Každá podmínka obsahuje:

Atribut:

jméno atributu (z výběru pozičních atributů korpusu)

Pozice:

číslo pozice, která se bude porovnávat.

Práce se seznamem je stejná jako v případě Obecného třídění. Po stisku tlačítka [Budiž] se provede výpočet a zobrazí se okno s výsledky.

V zobrazeném okně lze dodatečně měnit způsob zobrazení pomocí následujících ovládacích prvků:

Limit:

Analogicky jako u zadání se ve výsledku nezobrazí ty řádky, které mají spočítanou četnost menší nebo rovnu zadanému limitu. Počet zobrazovaných řádků se vždy spočítá a ukáže vedle.

Pro každou zadanou pozici je možné vybrat ze tří možností:

zobrazit

Slova na dané pozici se budou normálně zobrazovat.

součet

Slova na dané pozici se budou zobrazovat a navíc se pro ně bude počítat mezisoučet. Pro poslední pozici jsou volby zobrazit a součet totožné, protože se pro ni součet počítá vždy.

schovat

Daná pozice se v přehledu vůbec nebude počítat a zobrazovat.

Po libovolné změně limitu nebo zobrazovacích podmínek se provede nové zobrazení výsledku. Šířku jednotlivých sloupců lze upravit tažením nadpisu sloupce levým tlačítkem myši.

Kolokace

Vypočítá nejčetnější kolokace v zadaném kontextu podle následujících parametrů:

Atribut

Jméno atributu (z výběru pozičních atributů korpusu).

V rozsahu od, do

Počáteční resp. konečná pozice kontextu. Kladné hodnoty se počítají doprava od konce KWIC, záporné se počítají od začátku KWIC doleva.

Minimální četnost v korpusu

Statistiky se budou počítat pouze pro slova s celkovou četností v korpusu vyšší než zadaná četnost.

Minimální četnost v daném rozsahu

Statistiky se budou počítat pouze pro slova s četností v zadaném kontextu vyšší než zadaná četnost.

Maximální počet zobrazených řádků

Pokud je ve výsledku více řádků, zobrazí se pouze zadaný počet nejčetnějších.

Setřídit podle četnosti

Udává třídění, podle kterého se zobrazí výsledné řádky. Je důležité pouze pro výběr nejčetnějších řádků (viz předchozí parametr), zobrazené řádky lze potom třídit podle kterékoliv statistiky.

Třídění podle absolutní četnosti je blízké T-score, třídění podle relativní četnosti je shodné s MI-score. (Podrobnější popis níže.)

Výsledek je zobrazen ve formě tabulky, kterou lze uložit do souboru pomocí tlačítka Uložit. Tabulku je možné setřídit dle libovolného sloupce kliknutím pravým tlačítkem myši na nadpis požadovaného sloupce. Šířku jednotlivých sloupců lze upravit tažením nadpisu sloupce levým tlačítkem myši.

Hodnoty v jednotlivých sloupcích mají následující význam:

1. sloupec

je nadepsaný jménem počítaného atributu (např. word). Obsahuje hodnoty daného atributu (např. slova), pro které se statistiky počítaly.

MI-score

-- MI-score (vzájemná informace) slova a konkordance

T-score

-- T-score slova a konkordance

Rel. f

-- relativní četnost slova (kolik procent ze všech výskytů slova v korpusu je ve zvoleném kontextu)

Abs. f

-- absolutní četnost slova (kolikrát se slovo objevilo v zadaném kontextu)

Stiskem pravého tlačítka myši na zvoleném slově 1. sloupce se zobrazí lokální menu obsahující dvě položky: P filtr a N filtr. Výběrem jedné z položek se aplikuje příslušný filtr na aktuální konkordanci.

Rozložení

Zobrazí okno, které uvádí počet řádků výsledku (četnost) a tzv. redukovanou četnost konkordance. Dále je v něm graficky zobrazeno rozložení jednotlivých řádků výsledku v rámci celého korpusu. Na ose x jsou jednotlivé pozice korpusu, na ose y je počet výskytů v daném místě korpusu.

Pokud jsou jednotlivé řádky konkordančního seznamu v celém korpusu rovnoměrně rozloženy jsou jednotlivé čáry v grafu stejně dlouhé a jsou zobrazeny rovnoměrně po celé délce okna. Pokud naopak je většina řádků pouze z jednoho "místa" korpusu (například z jednoho dokumentu) je v jenom místě okna výrazně více delších čar.

Okno rozložení může sloužit i pro rychlé přemístění do "zajímavé" části konkordance. Kliknutím na libovolnou čáru v grafu se aktuální řádek konkordančního seznamu přemístí na řádek odpovídající zvolené čáře pod kurzorem myši.

3.5 Zobrazení

Reference

Určuje, jaké reference budou u jednotlivých řádků výsledku zobrazeny. Pokud je zatrženo číslo pozice, zobrazí se číslo pozice začátku KWIC. Zatržením jména značky (například doc) se zobrazí pořadové číslo dané značky v korpusu, ve které se KWIC nachází (například doc#91 znamená, že se dané KWIC nachází v 91. dokumentu od začátku korpusu). Při zatržení jména atributu značky (například doc.file) budou zobrazeny hodnoty daného atributu (například doc.file=A03 znamená, že dané KWIC se nachází v dokumentu, v němž má atribut file hodnotu A03). Reference se zobrazují zelenou barvou na začátku každého řádku.

Atributy

Určuje, které poziční atributy se mají zobrazovat.

Pouze v KWIC:

Vybrané atributy se budou zobrazovat pouze pro pozice v KWIC.

Pro všechny pozice:

Vybrané atributy se budou zobrazovat pro pozice v KWIC i pro všechna slova v zobrazeném kontextu.

Značky

Určuje, které značky (strukturní atributy) se budou zobrazovat. U značek, které obsahují atributy (například identifikátory vět id u značky <s>), je možné zatrhnout zvolený atribut. Potom se budou hodnoty tohoto atributu zobrazovat v příslušné značce (například <s id=12/3>).

Kontext

Určuje, v jakém kontextu se mají slova zobrazovat. Pro pravou i levou stranu může být jednotkou znak, pozice nebo libovolná ze strukturních značek. Pokud je kontext ve znacích (jednotka znak), zobrazí se celá slova tak, aby byl zobrazen minimálně zadaný počet znaků.

Rozsah

Udává, které řádky a v jakém počtu se mají zobrazovat. Pokud je počet zadaných řádků roven 0, zobrazují se všechny řádky.

O stránku nahoru/dolů

Načtou a zobrazí se další (nezobrazené) řádky (nová stránka) před resp. za zobrazenými řádky. Počet těchto řádků lze měnit v ->Manažer->Nastavení, implicitně je 20.

Skok na řádek

Zobrazí zvolený rozsah řádků (viz ->Zobrazení->Rozsah) od zadaného řádku. Číslo řádku, od kterého jsou řádky zobrazeny, je uveden ve stavovém řádku před znakem +.

3.6 Výběr

Vybrané řádky je možné přenést do schránky (viz níže), nebo smazat z konkordančního seznamu (menu ->Konkordance->Smazání vybraných). Vybrané řádky jsou v hlavním okně odlišeny modrým pozadím. Jejich počet je zobrazen ve stavové řádce na spodním okraji hlavního okna.

Výběr lze provádět myší nebo klávesami. Levé tlačítko myši nebo mezerník vybere nevybraný řádek, u vybraného řádku výběr zruší. Shift+levé tlačítko myši vybere všechny řádky mezi zvoleným řádkem a řádkem aktuálním.

Všechny

Označí všechny řádky.

Žádné

Zruší veškeré označení.

Inverze

Označí neoznačené řádky a zruší označení u označených řádků.

Vložit do schránky

Označené řádky vloží do schránky (clipboard) pro použití v jiných aplikacích.

Předat CEDu

Předá vybrané řádky korpusovému editoru CED. Tato funkce je dostupná pouze na platformě UNIX.

3.7 Nápověda

O aplikaci

Zobrazí stručnou informaci o aplikaci a číslo verze.

Zobrazení vysvětlivek

Při zapnutém stavu se automaticky zobrazují krátké vysvětlivky pro některé prvky uživatelského rozhraní, pokud se nad nimi na krátkou chvíli zastaví kurzor myši.

Dokumentace

Spustí se prohlížeč s dokumentací.

Licence

Zobrazí licenci, pod kterou je možné program používat.


Next Previous Contents