Skip to content

hw_1 Tsvetkova #31

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Open
wants to merge 7 commits into
base: master
Choose a base branch
from
Open
Show file tree
Hide file tree
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
Binary file not shown.
Binary file not shown.
Original file line number Diff line number Diff line change
@@ -0,0 +1,6 @@
{
"cells": [],
"metadata": {},
"nbformat": 4,
"nbformat_minor": 2
}
Original file line number Diff line number Diff line change
@@ -0,0 +1,29 @@
# Practical 1
##### Tsvetkova Victoria

### Segmentation
For this task I chose a wiki file in Hungarian. First I tried both suggested segmenters, and after searched on the Internet for some segmenters written for Hungarian. I found a [page](https://github.com/oroszgy/awesome-hungarian-nlp) with two presented. It took me a long time to try either, and they both didn't work: the first one was too outdated, and the second one required more memory than I have on my ubuntu.
So, now I am going to compare the ones being suggested in the practical:

##### 1. NLTK's Punkt
Used exactly as was said in practical 1.
Evaluation: 3 wrong out of 116 (~98% accuracy).
In general, the segmenter did great: there were only two difficult cases it couldn't segment correctly:

1) Hungarian abbreviations: "kb." standing for "körülbelül", "about" (compare with Russian "прим." for "примерно", about), and "stb." standing for "és a többi", "etc".
2) A bit more cunning example:

>'Közepes mélysége kb.\n',
'2 m; legnagyobb mélysége 10 m, de területének 60 %-án csak max.\n',
'2 m.\n',

When met two abbreviations and a digital at once ("max.", "m."), the segmenter failed to realise it as the same sentence. That that was also the sentence with "kb." mistake.

##### 2. Pragmatic_segmenter
Also, used as suggested on the practical page.
Evaluation: 4 wrong out of 116 (~98% accuracy).
The first three mistakes are the same as for NLTK's punct: "kb.", "stb." and "max.".
The forth one is quite interesting:
>Újságíróként írt többek között a magyar Kitekintő.\n',
'hu, Index.hu, Új Szó, illetve a szlovák .\n',
The segmenter failed to recognize a web address Kitekintő.hu, though the next one, Index.hu, wasn't segmented.
Original file line number Diff line number Diff line change
@@ -0,0 +1,50 @@

1954 és 1963 között a térségben a sztyeppet mintegy 420 000 km²-en feltörték és intenzív mezőgazdasági művelésbe vonták. A Kulunda-síkság Nyugat-Szibéria fontos mezőgazdasági körzete lett. Területének legnagyobb részén növénytermesztés folyik, gabonafélék (főleg tavaszi búza) és ipari növények szántóföldjei húzódnak, sok helyen mesterséges öntözést alkalmaznak.
1973 és 1983 között az SPG Silz/Mötz korosztályos csapataiban kezdte a labdarúgást. 1983 és 1986 között a Wacker Innsbruck, 1986 és 1988 között Linzer ASK labdarúgója volt. 1986 és 1992 között a Swavorski Tirol csapatában szerepelt és két bajnoki címet szerzett az együttessel, az utolsó idényben pedig bajnoki gólkirály lett 17 góllal. 1992-ben a Swarovski Tirol csőd miatt megszűnt. A következő két idényben a Wacker Innsbruck, majd a Tirol Innsbruck néven szerepelő csapatokban játszott. 1994–95-ben a Vorwärts Steyr, 1996–97-ben ismét a Linzer ASK játékosa volt. 1997-ben a ciprusi Ellínon Lefkoszíasz labdarúgója volt. 1998 és 2001 között Németországban játszott. 1998–99-ben az Eintracht Frankfurt, 2000-ben az FSV Frankfurt, 2001-ben a VfL Osnabrück csapataiban szerepelt.
1989 és 1993 között hat alkalommal szerepelt az osztrák válogatottban.
2000-ben a yanomami törzs ábrázolásáért megkapta a Lannan irodalmi díjat.
2002 és 2005 között a Wacker Tirol segédedzője volt. 2005 és 2007 között az Innsbrucker AC, 2008-ban az SV Völs vezetőedzőjeként tevékenykedett. 2011 és 2017 között az SV Horn segédedzője volt, közben 2014–15-ben vezetőedző, 2016-ban és 2017-ben ideiglenes megbízott vezetőedző volt. 2017–18-ban Kurt Garger segédedzője volt a kínai Junnan Fejhu csapatánál.
2008-ban jelölték a brazil Ordem do Mérito Cultural díjra.
2014 októberében a város egyes részeit az Iszlám Állam militánsai foglalták el. 2015 júniusában az iszlamista Dernai Mudzsahed Sura Tanács milíciái legyőzték az Iszlám Államot és ellenőrzésük alá vonták Dernát.
2018-ban munkásságáért a Goethe Intézettől Goethe-emlékérmet kapott.
63 éves korában hunyt el agyvérzésben. A Farkasréti temetőben helyezték örök nyugalomra, az unitárius egyház szertartása szerint.
A Baraba-alföld déli részén, a tóparttól délre "Majszkoje utro" ('májusi reggel') néven 1996-ban természetvédelmi terület létesült ( ha).
A behálózottsági együttható egy összefüggő síkgráf körszerkezetét hasonlítja össze két extrém példával. Az egyik véglet a fa, a körrel nem rendelkező síkgráf. A másik végletet a maximális síkgráfok, tehát az adott csúcs esetében maximális számú éllel és tartománnyal rendelkező síkbarajzolható gráfok képviselik. A normalizált behálózottsági együttható a rendelkezésre álló tartomány-körök és a maximálisan lehetséges tartomány-körök aránya.
A behálózottsági együtthatóval becsülni lehet egy hálózat redundanciáját. Ez a paraméter, a hálózat robusztusságát mérő algebrai összefüggőséggel együtt jól használható vízelosztási hálózatok hálózati ellenálló képessége topológiai aspektusának számszerűsítésére. Városi területek utcaszerkezetének jellemzésére is felhasználták.
A Csallóközben nőtt fel az 1980-as–1990-es években. Művészettörténetet tanult a Nagyszombati Egyetemen. Hűszéves korától összesen több évet dolgozott arab országokban (Egyiptom, Jordánia, Tunézia, Törökország). Újságíróként írt többek között a magyar Kitekintő.hu, Index.hu, Új Szó, illetve a szlovák .tyzden lapoknak, de jelentek meg írásai az ELLE magazin, a National Geographic, a WMN a szlovákiai magyar Új NŐ havilap, illetve a Vasárnap hasábjain is.
A Csani-tó (oroszul: "озеро Чаны," magyar átírásban: "ozero Csani)" sekély lefolyástalan sóstó Oroszország ázsiai részén, a Novoszibirszki területen. Nyugat-Szibéria legnagyobb állóvizeként tartják számon.
A Felső-Ob és az Irtis közötti lefolyástalan medencében, a Baraba-alföldön helyezkedik el. Beömlő folyója nincs, vízutánpótlást a délkeletre elterülő Kis-Csani-tóból kap egy rövid csatornán keresztül. A Kis-Csani-tó vízpótlását a beömlő Csulim folyó biztosítja.
A Felső-Ob és az Irtis közötti lefolyástalan medence egyik kisebb állóvize. A Novoszibirszki terület Kupinói- és Zdvinszki járásában, a Baraba-alföld és a Kulunda-síkság (Kulunda-sztyepp) érintkezésénél helyezkedik el. A Csani-tótól "(Nagy-Csani-tó)" délkeletre terül el, melyhez keskeny csatornával kapcsolódik. Csak egyetlen jelentősebb folyó táplálja, a Csulim.
A Gerson-terápia Max Gersonról (1881–1959) elnevezett egészség-helyreállító módszer.
A Kis-Csani-tó (oroszul: "Малые Чаны," magyar átírásban: "Malije Csani)" sekély lefolyástalan sóstó Oroszország ázsiai részén, a Novoszibirszki területen.
A közép-brazíliai karajá törzs tanulmányozása közben éledt benne fel a fotóriporter-hivatás. Képeit több híres magazin publikálta: Life, Look, Fortune, Aperture és Realidade.
A Kulunda-síkság, régebben többnyire: "Kulunda-sztyepp," vagy egyszerűen "Kulunda" (oroszul: "Кулундинская равнина, Кулундинская степь, Кулунда") tájegység Nyugat-Szibéria déli részén, a Felső-Ob és az Irtis között. Közigazgatásilag legnagyobb része Oroszország Altaji határterületéhez és (kisebb északi része) a Novoszibirszki területhez, valamint Kazahsztán Pavlodari területéhez tartozik.
A Kulunda-tavak a köznyelvben a síkság sekély sóstóinak összefoglaló elnevezése. Ide tartozik maga a Kulunda-tó és a „szomszédos” Kucsuk-tó, melynek partján nátriumszulfát-kombinát épült, valamint azoktól keletre és délre sok kisebb lefolyástalan sóstó. E tavak szódakészlete világviszonylatban az elsők között áll(t) évek, de konyha- és egyéb sókat is nagy mennyiségben tartalmaznak. Az itteni készletek hasznosítására építették fel Oroszország első szódagyárát 1864-ben.
A Kulunda-tó (oroszul: "Кулундинское озеро," magyar átírásban: "Kulungyinszkoje ozero)" sekély lefolyástalan sóstó Oroszország ázsiai részén, az Altaji határterületen, melynek legnagyobb állóvize.
A lapos partokon nád, sás, különféle cserje nő; a tófenék homokos és iszapos, a vízben 16 halfaj él. Nagyon sok a sziget, több közülük ritka növény- és állatfaj élőhelye, ritka madarak fészkelőhelye. A tavaszi-őszi madárvonulások idején a táj vízimadarak óriási csapatainak nyújt pihenési lehetőséget. A ritka vagy veszélyeztetett madarak között említhető a lócsér, a halászsirály, a gólyatöcs, a gulipán, a viharsirály, a feketeszárnyú székicsér vagy a szalonkafélék közül a ázsiai cankógoda "(Limnodromus semipalmatus)."
Alkalmazások.
Al Kuba:
Al Kuba (arab القبة, angol "Al Qubbah") város Líbia északkeleti részében, a Földközi-tenger közelében. A 2007-ig létezett Kuba tartomány székhelye volt. Darna és Al-Bajda között a legnépesebb lakott hely.
Állatvilágára a sok rágcsáló, a tavak környékére a változatos madárvilág jellemző.
Általánosabban, az Euler-karakterisztika használatával megmutatható, hogy minden "n"-csúcsú síkbarajzolható gráf legfeljebb 2"n" − 5 korlátos tartománnyal rendelkezik (nem számolva tehát a korlátlan tartományt)
A matematika, azon belül a gráfelmélet területén a behálózottsági együttható vagy ciklomatikus együttható "(meshedness coefficient)" síkbarajzolható gráfok olyan gráfinvariánsa, ami a gráf korlátos tartományainak számát méri az ugyanannyi csúcson előállítható síkbarajzolható gráfok lehetséges tartományai számának arányában. Minimális értéke 0, amit fák esetében, maximális értéke 1, amit maximális síkgráfokon vesz fel.
A módszer során megtanított beöntéstechnika, amikor a betegek vagy akik megelőzésként, hétköznapi tisztításként akarják használni a Gerson-módszer egyes elemeit, ezt elsajátítják, akkor már nagy megkönnyebbülést, tisztaságérzést, örömet hoz az életükbe.
A nyugatabbra fekvő Szlavgorodon és Kulundán kívül, közelebbi városi jellegű települések: Blagovescsenka járási székhely és Sztyepnoje Ozero. Az utóbbi vegyipari kombinátjában a Kucsuk-tóból kinyert mirabilit feldolgozásával nátrium-szulfátot állítanak elő.
A Nyugat-szibériai-alföld déli részén, a sztyepp övben fekszik. Északon a Baraba-alföld erdős-sztyeppje terül el, nyugaton az Irtis völgyén túli Isim-hátság, keleten-délkeleten az Ob-menti-hátság és az Altaj előhegyei határolják. Feltöltött síkság, melyet folyóvízi és tavi üledék tölt ki. Területének jelentős részét lösz borítja.
A számítógép-programozásban a varázsszó egy olyan bemenet, ami egy egyébként rejtett funkciót támogat. A felhasználókat nem értesítik erről, mivel azt hiszik, hogy úgysem fogják megtalálni. Ez azonban nem igaz; ha elegen használják a programot, akkor előbb-utóbb felfedezik ezeket, akár véletlenül is. Számukra megmagyarázhatatlan módon, mintegy varázsszóra a program elkezd máshogy működni.
A sztyepp eredeti jellegzetes, ürmös-árvalányhajas növényzete szinte teljesen eltűnt, területének nagy részét felszántották, mezőgazdasági művelésbe vették. Kisebb nyírfaligetek vagy fenyvesek inkább csak a mélyedésekben, folyóvölgyekben fordulnak.
A sztyepp felszántásának negatív hatásai azonban hamarosan megmutatkoztak. Az intenzív szélerózió következtében az eredeti lösztakaró csökkent vagy teljesen eltünt; a talaj vízháztartása megbomlott, termőképessége csökkent. A 2010-es években nemzetközi tervek készültek a kedvezőtlen folyamatok visszafordítására.
A sztyepp övezetben elterülő Kulunda-síkság (vagy "Kulunda-sztyepp)" északkeleti részén helyezkedik el, az orosz–kazah országhatártól kb. 80 km-re, Szlavgorodtól 65 km-re keletre. A tóba két folyó ömlik, a Kulunda és a Szujetka; kivezető folyója nincs (lefolyástalan tó). A tótól délre található a kisebb és alacsonyabban fekvő Kucsuk-tó, mellyel néhány kilométeres csatorna köti össze.
A Tanatar-tó (valójában több kisebb tó sorozata) sókészletére alapozva hozták létre a második világháború idején a kalcináltszóda-gyárat "Malinovoje Ozero" településen (Mihajlovszkoje falu mellett). Magát a tavat "(Malinovoje Ozero," jelentése: 'málna-tó') különös, rózsaszínű vizéről nevezték el. Szlavgorod mellett, a brómban gazdag Bolsoje Jarovoje-tó vizének hasznosítására is nagy vegyipari gyár létesült; az évek folyamán a területen önálló város épült: Jarovoje.
A tavaszi-őszi madárvonulások idején a tó több mint kétszázezer vízimadár (lúdalakúak, lilealakúak, sirályfélék, stb.) pihenőhelye. A part körüli sztyeppen több kiemelten védett madárfaj, köztük fakó rétihéja, kerecsensólyom, fehérkarmú vércse, kékcsőrű réce él.
A tó hossza 91 km, szélessége 88 km. Közepes mélysége kb. 2 m; legnagyobb mélysége 10 m, de területének 60 %-án csak max. 2 m. Vízfelületének tengerszint feletti magassága 106 m. Területe korábbi adatok szerint 1990–2600 km², más forrás szerint 1400– 3500 km². Vízszintje és a víztükör kiterjedése ugyanis évenként és évszakoktól függően is rendkívül ingadozó.
A tó körül tizenkét kisebb falu található, a partvidék környékét kaszálónak, legelőnek használják. Az északi tópart és a Csani–Barabinszk vasútvonal közötti erdős sztyeppen (Baraba-alföld), a Novoszibirszki terület Barabinszki- és a Csani járásában 1958-ban természetvédelmi területet hoztak létre ( ha).
A túl közeli határidő már a projekt kezdetétől nyomaszthatja a programozókat, amin a vezetőség vagy a felhasználók nem akarnak változtatni. Gyakori helyzetek, amikor ez az antiminta jelentkezhet:
A válogatottban.
A varázsszavak használatának oka a szűk határidő. Ahelyett, hogy a programozó mélyebben belemerülne a problémába, és jobb megoldást találna, varázsszavakat kezd használni.
A vasútállomáshoz az alábbi állomások vannak a legközelebb:
A víz nem nagyon sós, – északi partját ezért is sok fürdőző keresi fel –, de sókoncentrációja a kiszáradás hatására növekszik. A térség többi sóstavához hasonlóan itt is hatalmas mennyiségű sórák él. A tóban mirabilit, a tófenéken jelentős mennyiségű gyógyiszap található.
Az állomást az alábbi vasútvonalak érintik:
Az arány fák esetében 0, maximális síkgráfok esetében 1.
Az átlagos fokszám definícióját használva – formula_2 – látható, hogy nagy gráfok esetében a határ (élek száma a behálózottsági együttható tart:
Az észak-brazíliai yanomami törzzsel 1971-ben találkozott egy riport kapcsán. Az újságírással felhagyva, kultúrájukat éveken keresztül fotóesszékben dokumentálta; 1998-ban jelent meg könyve "Yanomami: a ház, az erdő, a láthatatlan" címmel. A yanomami törzs a világtól elszigetelten élt. 1974-ben autópálya épült a területükön, és a külső behatolás következtében súlyos himlőjárvány tört ki. A fotográfus azonnal felfüggesztette tevékenységét, hogy orvosi segítséget hozhasson nekik. A nyolcvanas években az aranybányászat hozott újabb egészségügyi problémákat, maláriát és higanymérgezést. A yanomami populáció 20%-a elpusztult. Andujar komoly szerepet játszott egy bizottságon keresztül a Yanomami Park létrehozásában, amely keretében a brazil kormány 96 000 km2 védett területet biztosított a törzsnek.
Loading