Tato kapitola popisuje postupně všechny položky menu. V textu je používáno označení ->Menu->Položka pro položku Položka z menu Menu.
Provede připojení na server. Bez připojení nelze provádět žádné operace s korpusy. Je možné se připojit buď na vzdálený server pomocí Internetu/intranetu, nebo spustit server lokálně. Pokud je v konfiguraci nastaveno spuštění serveru lokálně, provede se po startu Bonita automaticky připojení. V opačném případě se automaticky vybere tato položka menu a v následně zobrazeném okně je nutné zadat jméno a heslo uživatele.
Připojení se provede na vzdálený server, jehož adresa je ve vstupním řádku Adresa serveru, s použitím zadaného jména a hesla.
Server se spustí lokálně, tedy na stejném počítači, na kterém běží Bonito. V tomto případě musí být celý manažer i se všemi použitými korpusy nainstalován na daném počítači. Jméno a heslo uživatele je ignorováno a přístup ke zvoleným korpusům je dán přístupovými právy k datovým souborům jednotlivých korpusů. Pro spuštění serveru se použije příkaz ve vstupním řádku Příkaz serveru.
Adresa počítače, na kterém server běží,
například aurora.fi.muni.cz
.
Jméno (login) a heslo uživatele pro přístup ke Bonito (může se lišit od jména i/nebo hesla pro běžný přístup) na daném serveru. Text hesla se ve vstupním řádku nezobrazuje.
Příkaz, kterým se provede spuštění
serveru (například: manateesrv "desam susanne" 2>errlog
).
Změna hesla pro přístup ke Bonito. Je nutné zadat současné (původní) heslo a dvakrát heslo nové. Text žádného z hesel se ve vstupních řádcích nezobrazuje.
Provede opětovné zobrazení řádků výsledku (podle zadání v ->Zobrazení->Rozsah).
Umožní nastavit různé uživatelské volby aplikace, případně uložit volby pro příští spuštění. Implicitní hodnoty voleb jsou nastaveny tak, aby vyhovovaly většině uživatelů. Pokročilí uživatelé mohou měnit tyto volby:
Volba jazyka uživatelského rozhraní. Zvolený jazyk bude použit i při příštím spuštění programu.
Ukončení aplikace.
Zobrazí souhrnné informace o vybraném korpusu: jeho jméno a případná dodatečná informace o korpusu z jeho konfiguračního souboru, velikost (celkový počet pozic), poziční atributy a strukturní značky. Pro každý poziční atribut je zobrazen počet různých prvků ve slovníku daného atributu (dle atributu tedy počet různých slov, základních tvarů, značek atd.). Pro každou strukturní značku je zobrazen její celkový počet výskytů v korpusu.
Pro zadané hodnoty atributů vypočte a zobrazí četnosti hodnot v celém korpusu, četnost bigramu v korpusu, množství vzájemné informace (MI-score) a T-score.
Bigramy se hledají s použitím zadaného okna. Implicitní hodnoty od 1 do 1 znamenají, že má druhé slovo přímo následovat první slovo. Od 1 do 5 znamená velikost okna 5, tedy mezi prvním a druhým slovem mohou být až 4 jiné pozice. Záporná znaménka znamenají opačné pořadí výskytu. Od -1 do -1 tedy znamená, že druhé slovo má přímo předcházet první slovo. Od -5 do 5 potom znamená, že slova mají být od sebe vzdálená maximálně 5 pozic a mohou být v libovolném pořadí.
Ze zvoleného korpusu vytvoří subkorpus podle zadaných podmínek. Subkorpus je možné použít pouze pro hledání. Pro výpočet všech statistik se používá vždy celý korpus.
Jméno korpusu, ze kterého se bude subkorpus vytvářet. Jedná se o aktuální korpus z hlavního okna aplikace.
Po úspěšném vytvoření subkorpusu se v seznamu korpusů objeví nový korpusu ve tvaru základní korpus:jméno subkorpusu. Pokud například vytvoříme subkorpus se jménem press z korpusu susanne v seznamu korpusů bude susanne:press.
Jméno značky (strukturního atributu), podle které se má subkorpus vytvářet. V subkorpusu budou potom všechny pozice, které jsou součástí značky vyhovující zadané podmínce. Většinou se tvoří subkorpusy podle značky nejvyšší úrovně, které odpovídají jednotlivým dokumentům či textům korpusu.
Podmínka omezující některé atributy zadané značky. Například v korpusu Susanne jsou tiskové zprávy v dokumentech, jejichž jména začínají na A. Dokumentům odpovídá značka <doc>, jména dokumentů jsou v atributu file. Pro vytvoření subkorpusu tiskových zpráv z korpusu Susanne tedy zapíšeme podmínku:
file = "A.."
Zobrazí aktuální seznam subkorpusů, ze kterého je možné zvolené subkorpusy mazat.
Zobrazí všechny slova ze slovníku zadaného atributu, která vyhovují danému vzoru.
Umožňuje změnit implicitní atribut, podle kterého se provádí vyhodnocování dotazů bez zadaného jména atributu.
Provede vyhodnocení dotazu (resp. P filtru, N filtru nebo kolokace). Vyhodnocení probíhá na serveru, Bonito pouze čeká na předání výsledku. Operaci lze zastavit pomocí tlačítka Stop, které se aktivací funkce zobrazí vpravo od jména korpusu.
Zobrazí seznam pojmenovaných dotazů, ze kterého je možné vybrat dotaz pro vyhodnocení, popř. smazat některý dotaz z tohoto seznamu.
Zobrazí seznam předloh (viz kapitola 4. Předlohy), ze kterého lze vybrat předlohu pro vyhodnocení, smazat některou předlohu z tohoto seznamu, přidat novou předlohu, popř. změnit text nebo popis vybrané předlohy.
Zobrazí okno, ve kterém je možné vytvářet dotaz pomocí grafických prvků.
Přidá do seznamu předloh novou předlohu.
jméno předlohy, které se potom bude používat v dotazech
vlastní text předlohy
volitelný popis předlohy
Po zvolení souboru s předlohami (například od jiného
uživatele) přidá nové předlohy do seznamu předloh. Soubory s
předlohami mají koncovku tpl
.
Po zvolení souboru s dotazy (například od jiného
uživatele) přidá nové dotazy k pojmenovaným dotazům. Soubory s
dotazy mají koncovku qry
. Importovat je možné i soubor
s historií (history.qry
), ze kterého se vyberou pouze
pojmenované dotazy.
Zobrazí souhrnné informace o konkordanci: jméno korpusu, velikost konkordance a seznam jednotlivých operací (počínaje dotazem), které vedly k vytvoření konkordance.
Uloží zvolené řádky konkordančního seznamu do souboru.
výběr kódování znaků uložených řádků
(hodnota `-
' znamená kódování, ve kterém je korpus
uložen na serveru)
výběr formátu hlavičky pro uložení informací o dotazu
uloží pouze aktuálně zobrazené řádky
uloží všechny řádky konkordančního seznamu
při zaškrtnutí budou ve výstupním souboru jednotlivé řádky očíslovány
při zaškrtnutí budou klíčová slova zarovnány pod sebou
Tlačítkem Kontext je možné změnit kontext pro uložení, který je implicitně stejný s kontextem pro zobrazování (viz ->Zobrazení->Kontext). Po stlačení tlačítka Uložit je nutné zadat nebo vybrat jméno souboru, do kterého se má konkordanční seznam uložit.
Vytiskne zvolené řádky konkordančního seznamu na tiskárně, zadávají se stejné informace jako pro ->Konkordance->Uložení.
Smaže označené řádky konkordančního seznamu (viz menu ->Výběr). Počet vybraných řádků je zobrazen ve stavovém řádku u spodního okraje hlavního okna. V závislosti na aktuálním rozsahu zobrazených řádků některé vybrané řádky nemusí být právě zobrazeny.
Redukce počtu řádků konkordančního seznamu. Zadává se, které řádky mají ve výsledku zůstat a kolik řádků, procent či setin procenta z původního počtu řádků má zůstat.
Setřídí konkordanční seznam podle zadaných kritérií.
počet pozic, podle kterých se bude třídit
Udává, které pozice z řádku se budou při třídění porovnávat. V následujícím schématu předpokládáme Počet tříděných pozic = 3. Číslo 1 znamená nejvýznamnější pozici (bude se podle ní třídit nejdříve), číslo 3 nejméně významnou pozici (bude se podle ní třídit až nakonec).
........ <KWIC KWIC> ............ levý kontext 3 2 1 < > KWIC odleva <1 2 3 > KWIC odprava < 3 2 1> pravý kontext < > 1 2 3
Při třídění nebude záležet na velikosti písmen.
Jednotlivá slova se budou třídit od posledního písmene k prvnímu.
Podle kterého pozičního atributu se má třídění provádět -- výběr z možných pozičních atributů daného korpusu.
Setřídí konkordanční seznam podle seznamu třídicích podmínek. Každá třídicí podmínka určuje jednu pozici, podle které se budou jednotlivé řádky porovnávat.
Pokud je zatrženo, ze všech řádků, které se shodují ve všech třídicích intervalech, se ve výsledku ponechá pouze jeden.
přidá další třídicí podmínku
smaže vybraný interval (výběr se provádí kliknutím myší)
provede třídění
zavře okno bez jakéhokoli třídění
Každá třídicí podmínka obsahuje:
číslo pozice, která se bude porovnávat. Opět záporná čísla znamenají pozice před, kladná znamenají za zvoleným počátkem.
udává počátek počítání pozic stejně jako při zadávání filtrů nebo kolokací (viz kap. 3. Tvorba dotazu).
z výběru pozičních atributů korpusu
ignorovat velikost písmen
Odzadu -- třídit retrográdně
Provede třídění podle průměrné četnosti slov z zadaném kontextu. Na prvních řádcích konkordance jsou po třídění kontexty obsahující nejčastější slova.
Seskupí řádky podle přiřazených čísel skupin. Jednotlivé skupiny budou setříděny vzestupně (první bude skupina číslo 1), na konci konkordance budou řádky, kterým nebyla žádná skupina přiřazena.
Provede návrat k předchozí konkordanci a zobrazí ji. Touto operací lze zrušit provedené změny v konkordanci (redukce, mazání, použití filtrů) nebo provedené třídění. Funkci je možné použít opakovaně, maximální počet uchovaných konkordancí lze měnit v ->Manažer->Nastavení, implicitně je 5.
Zopakuje operaci, která byla zrušena akcí Zpět k předchozí.
Pojmenuje zobrazenou konkordanci. Pojmenované konkordance jsou přímo dostupné v menu ->Konkordance->Pojmenované.
Pokud potřebujeme pracovat opakovaně s výsledkem jediného dotazu, pojmenujeme si výslednou konkordanci a můžeme se k ní kdykoliv rychle vrátit, aniž by se musel znovu vyhodnocovat dotaz.
Slouží k zrušení některých pojmenovaných konkordancí. Zobrazí se seznam všech pojmenovaných konkordancí. Výběrem ze seznamu a stlačením tlačítka Smazat se zvolená konkordance zruší.
Spočítá četnosti slov nebo jiných atributů nebo jejich posloupností na zadaných pozicích.
Do výsledku se budou počítat a zobrazovat pouze posloupnosti s četností vyšší než je zadaný limit. Implicitní limit 0 znamená, že se budou počítat všechny hodnoty. Pro konkordanční seznam s velkým počtem řádků to může znamenat velké množství předávaných dat ze serveru a následné náročné třídění výsledku.
Pokud se má zobrazit více řádků (konkrétní číslo závisí na výkonu počítače, běžně více než několik tisíc) může jejich zobrazení trvat příliš dlouho.
Každá podmínka obsahuje:
jméno atributu (z výběru pozičních atributů korpusu)
číslo pozice, která se bude porovnávat.
V zobrazeném okně lze dodatečně měnit způsob zobrazení pomocí následujících ovládacích prvků:
Analogicky jako u zadání se ve výsledku nezobrazí ty řádky, které mají spočítanou četnost menší nebo rovnu zadanému limitu. Počet zobrazovaných řádků se vždy spočítá a ukáže vedle.
Pro každou zadanou pozici je možné vybrat ze tří možností:
Slova na dané pozici se budou normálně zobrazovat.
Slova na dané pozici se budou zobrazovat a navíc se pro ně bude počítat mezisoučet. Pro poslední pozici jsou volby zobrazit a součet totožné, protože se pro ni součet počítá vždy.
Daná pozice se v přehledu vůbec nebude počítat a zobrazovat.
Po libovolné změně limitu nebo zobrazovacích podmínek se provede nové zobrazení výsledku. Šířku jednotlivých sloupců lze upravit tažením nadpisu sloupce levým tlačítkem myši.
Vypočítá nejčetnější kolokace v zadaném kontextu podle následujících parametrů:
Jméno atributu (z výběru pozičních atributů korpusu).
Počáteční resp. konečná pozice kontextu. Kladné hodnoty se počítají doprava od konce KWIC, záporné se počítají od začátku KWIC doleva.
Statistiky se budou počítat pouze pro slova s celkovou četností v korpusu vyšší než zadaná četnost.
Statistiky se budou počítat pouze pro slova s četností v zadaném kontextu vyšší než zadaná četnost.
Pokud je ve výsledku více řádků, zobrazí se pouze zadaný počet nejčetnějších.
Udává třídění, podle kterého se zobrazí výsledné řádky. Je důležité pouze pro výběr nejčetnějších řádků (viz předchozí parametr), zobrazené řádky lze potom třídit podle kterékoliv statistiky.
Třídění podle absolutní četnosti je blízké T-score, třídění podle relativní četnosti je shodné s MI-score. (Podrobnější popis níže.)
Výsledek je zobrazen ve formě tabulky, kterou lze uložit do souboru pomocí tlačítka Uložit. Tabulku je možné setřídit dle libovolného sloupce kliknutím pravým tlačítkem myši na nadpis požadovaného sloupce. Šířku jednotlivých sloupců lze upravit tažením nadpisu sloupce levým tlačítkem myši.
Hodnoty v jednotlivých sloupcích mají následující význam:
je nadepsaný jménem počítaného atributu (např. word). Obsahuje hodnoty daného atributu (např. slova), pro které se statistiky počítaly.
-- MI-score (vzájemná informace) slova a konkordance
-- T-score slova a konkordance
-- relativní četnost slova (kolik procent ze všech výskytů slova v korpusu je ve zvoleném kontextu)
-- absolutní četnost slova (kolikrát se slovo objevilo v zadaném kontextu)
Stiskem pravého tlačítka myši na zvoleném slově 1. sloupce se zobrazí lokální menu obsahující dvě položky: P filtr a N filtr. Výběrem jedné z položek se aplikuje příslušný filtr na aktuální konkordanci.
Zobrazí okno, které uvádí počet řádků výsledku (četnost) a tzv. redukovanou četnost konkordance. Dále je v něm graficky zobrazeno rozložení jednotlivých řádků výsledku v rámci celého korpusu. Na ose x jsou jednotlivé pozice korpusu, na ose y je počet výskytů v daném místě korpusu.
Pokud jsou jednotlivé řádky konkordančního seznamu v celém korpusu rovnoměrně rozloženy jsou jednotlivé čáry v grafu stejně dlouhé a jsou zobrazeny rovnoměrně po celé délce okna. Pokud naopak je většina řádků pouze z jednoho "místa" korpusu (například z jednoho dokumentu) je v jenom místě okna výrazně více delších čar.
Okno rozložení může sloužit i pro rychlé přemístění do "zajímavé" části konkordance. Kliknutím na libovolnou čáru v grafu se aktuální řádek konkordančního seznamu přemístí na řádek odpovídající zvolené čáře pod kurzorem myši.
Určuje, jaké reference budou u jednotlivých řádků výsledku zobrazeny. Pokud je zatrženo číslo pozice, zobrazí se číslo pozice začátku KWIC. Zatržením jména značky (například doc) se zobrazí pořadové číslo dané značky v korpusu, ve které se KWIC nachází (například doc#91 znamená, že se dané KWIC nachází v 91. dokumentu od začátku korpusu). Při zatržení jména atributu značky (například doc.file) budou zobrazeny hodnoty daného atributu (například doc.file=A03 znamená, že dané KWIC se nachází v dokumentu, v němž má atribut file hodnotu A03). Reference se zobrazují zelenou barvou na začátku každého řádku.
Určuje, které poziční atributy se mají zobrazovat.
Vybrané atributy se budou zobrazovat pouze pro pozice v KWIC.
Vybrané atributy se budou zobrazovat pro pozice v KWIC i pro všechna slova v zobrazeném kontextu.
Určuje, které značky (strukturní atributy) se budou
zobrazovat. U značek, které obsahují atributy (například
identifikátory vět id u značky
<s>
), je možné zatrhnout zvolený atribut. Potom
se budou hodnoty tohoto atributu zobrazovat v příslušné značce
(například <s id=12/3>).
Určuje, v jakém kontextu se mají slova zobrazovat. Pro pravou i levou stranu může být jednotkou znak, pozice nebo libovolná ze strukturních značek. Pokud je kontext ve znacích (jednotka znak), zobrazí se celá slova tak, aby byl zobrazen minimálně zadaný počet znaků.
Udává, které řádky a v jakém počtu se mají zobrazovat. Pokud je počet zadaných řádků roven 0, zobrazují se všechny řádky.
Načtou a zobrazí se další (nezobrazené) řádky (nová stránka) před resp. za zobrazenými řádky. Počet těchto řádků lze měnit v ->Manažer->Nastavení, implicitně je 20.
Zobrazí zvolený rozsah řádků (viz ->Zobrazení->Rozsah) od zadaného řádku. Číslo řádku, od kterého jsou řádky zobrazeny, je uveden ve stavovém řádku před znakem +.
Vybrané řádky je možné přenést do schránky (viz níže), nebo smazat z konkordančního seznamu (menu ->Konkordance->Smazání vybraných). Vybrané řádky jsou v hlavním okně odlišeny modrým pozadím. Jejich počet je zobrazen ve stavové řádce na spodním okraji hlavního okna.
Výběr lze provádět myší nebo klávesami. Levé tlačítko myši nebo mezerník vybere nevybraný řádek, u vybraného řádku výběr zruší. Shift+levé tlačítko myši vybere všechny řádky mezi zvoleným řádkem a řádkem aktuálním.
Označí všechny řádky.
Zruší veškeré označení.
Označí neoznačené řádky a zruší označení u označených řádků.
Označené řádky vloží do schránky (clipboard) pro použití v jiných aplikacích.
Předá vybrané řádky korpusovému editoru CED. Tato funkce je dostupná pouze na platformě UNIX.
Zobrazí stručnou informaci o aplikaci a číslo verze.
Při zapnutém stavu se automaticky zobrazují krátké vysvětlivky pro některé prvky uživatelského rozhraní, pokud se nad nimi na krátkou chvíli zastaví kurzor myši.
Spustí se prohlížeč s dokumentací.
Zobrazí licenci, pod kterou je možné program používat.