Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

FI Feedback #637

Open
10 of 15 tasks
matyaskopp opened this issue Apr 24, 2023 · 9 comments · Fixed by #564
Open
10 of 15 tasks

FI Feedback #637

matyaskopp opened this issue Apr 24, 2023 · 9 comments · Fixed by #564
Milestone

Comments

@matyaskopp
Copy link
Collaborator

matyaskopp commented Apr 24, 2023

missing terms in data

  • corpus root meeting element
  • parliament organization events

According to wiki Finland has 4-year terms. So parliament organization should contain these events and meeting elements should refer to these events.
Something like:
(https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L517-L559)

               <org ana="#parla.uni #parla.national"
                    role="parliament"
                    xml:id="fi_parliament">
                  <orgName full="yes" xml:lang="fi">Suomen eduskunta</orgName>
                  <orgName full="yes" xml:lang="en">Parliament of Finland</orgName>
                  <event from="1907-05-23">
                     <label xml:lang="en">existence</label>
                  </event>
                  <idno type="wikimedia" xml:lang="fi">https://fi.wikipedia.org/wiki/Eduskunta</idno>
                  <idno type="wikimedia" xml:lang="en">https://en.wikipedia.org/wiki/Parliament_of_Finland</idno>
                  <listEvent>
                     <head xml:lang="en">Legislative term</head>
                     <event from="2015-04-19" to="2019-04-13" xml:id="parl_term.37">
                        <label xml:lang="fi">Valtiopäivät 2015 (22.4.2015 - 1.2.2016)</label>
                        <label xml:lang="en">Parliamentary term 37 (19.4.2015 - 13.4.2019)</label>
                     </event>
<!-- ... -->
                  </listEvent>
               </org>

and corresponding meeting element should be
(https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L10-L12)

  <meeting ana="#parla.term #parla.uni #parl_term.37" n="37" corresp="#fi_parliament">37</meeting>

Component files meeting element

  • component files meeting element:
    • term
    • session
    • meeting
    • sitting

https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI_2015-05-22-ps-7.xml#L13-L15

            <meeting ana="#parla.uni #parla.sitting #parl_session.2015"
                     corresp="#fi_parliament"
                     n="7">Täysistunto 7</meeting>

should be fixed and extended in this way:

<!-- I don't understand Finnísh, but it seems that 2015 is session, 7 is meeting and 2015-05-22 is sitting day -->
<meeting ana="#parla.uni #parla.term #parl_term.37" corresp="#fi_parliament" n="37"><!-- ...TERM... --></meeting>
<meeting ana="#parla.uni #parla.session" corresp="#fi_parliament" n="2015"></meeting>
<meeting ana="#parla.uni #parla.meeting" corresp="#fi_parliament" n="7">Täysistunto 7</meeting>
<meeting ana="#parla.uni #parla.sitting" corresp="#fi_parliament" n="2015-05-22"><!-- --></meeting>

missing notes

  • speaker notes
  • time notes
  • other notes

https://www.eduskunta.fi/FI/vaski/PoytakirjaAsiakohta/Sivut/PTK_7+2015+2.aspx
image

https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI_2015-05-22-ps-7.xml#L107-L112

            <u ana="#regular"
               who="#EskoKiviranta"
               xml:id="ParlaMint-FI_2015-05-22-ps-7.u2">
               <seg xml:id="ParlaMint-FI_2015-05-22-ps-7.seg2">Arvoisa puhemies! Käsittelyssä on eduskunnan ensimmäinen mietintö alkaneella vaalikaudella. Hallituksen esitys ei sisällöllisesti ole erityisen haastava. Siinä ehdotetaan muutettavaksi ulkomaalaislain 36 §:ää, jossa säädetään oleskeluluvan myöntämisen yleisistä edellytyksistä. Vielä tällä hetkellä on voimassa ulkomaalaislain 36 §:n 1 momenttiin vuodesta 2007 sisältynyt virke, jonka mukaan kansanterveyden vaarantaminen ei estä jatkoluvan myöntämistä, jos luvan myöntämisen edellytykset ovat muutoin olemassa. Kyseinen virke, joka siis sisältyy vielä voimassa olevaan lakiin, on pudonnut viime vaalikauden lopulla lainkohtaa uudistettaessa epähuomiossa pois lakiehdotuksesta. Tämä tarkoittamaton muutos on nyt tulossa voimaan lailla 507/2015 aivan lähiaikoina, tarkemmin sanottuna runsaan viikon päästä 1.6.2015.</seg>
               <seg xml:id="ParlaMint-FI_2015-05-22-ps-7.seg3">Kysymys on siis lakiin syntymässä olevan, puhtaasti teknisen virheen korjaamisesta. On toivottavaa ja suotavaa, että eduskunta omalta osaltaan hyväksymällä käsiteltävänä olevan lakiehdotuksen pitää huolta siitä, että oikeusjärjestys on siinä muodossa kuin on tarkoitettu. Hallintovaliokunta on kuullut esityksen johdosta asiantuntijoita, käynyt keskustelun ja päättänyt yksimielisesti puoltaa hallituksen esityksen hyväksymistä muuttamattomana.</seg>
            </u>

should be:

<note>Keskustelu</note>
<note type="time">13.16</note>
<note type="speaker">Esko Kiviranta kesk (esittelypuheenvuoro):</note>
            <u ana="#regular"
               who="#EskoKiviranta"
               xml:id="ParlaMint-FI_2015-05-22-ps-7.u2">
               <seg xml:id="ParlaMint-FI_2015-05-22-ps-7.seg2">Arvoisa puhemies! Käsittelyssä on eduskunnan ensimmäinen mietintö alkaneella vaalikaudella. Hallituksen esitys ei sisällöllisesti ole erityisen haastava. Siinä ehdotetaan muutettavaksi ulkomaalaislain 36 §:ää, jossa säädetään oleskeluluvan myöntämisen yleisistä edellytyksistä. Vielä tällä hetkellä on voimassa ulkomaalaislain 36 §:n 1 momenttiin vuodesta 2007 sisältynyt virke, jonka mukaan kansanterveyden vaarantaminen ei estä jatkoluvan myöntämistä, jos luvan myöntämisen edellytykset ovat muutoin olemassa. Kyseinen virke, joka siis sisältyy vielä voimassa olevaan lakiin, on pudonnut viime vaalikauden lopulla lainkohtaa uudistettaessa epähuomiossa pois lakiehdotuksesta. Tämä tarkoittamaton muutos on nyt tulossa voimaan lailla 507/2015 aivan lähiaikoina, tarkemmin sanottuna runsaan viikon päästä 1.6.2015.</seg>
               <seg xml:id="ParlaMint-FI_2015-05-22-ps-7.seg3">Kysymys on siis lakiin syntymässä olevan, puhtaasti teknisen virheen korjaamisesta. On toivottavaa ja suotavaa, että eduskunta omalta osaltaan hyväksymällä käsiteltävänä olevan lakiehdotuksen pitää huolta siitä, että oikeusjärjestys on siinä muodossa kuin on tarkoitettu. Hallintovaliokunta on kuullut esityksen johdosta asiantuntijoita, käynyt keskustelun ja päättänyt yksimielisesti puoltaa hallituksen esityksen hyväksymistä muuttamattomana.</seg>
            </u>

Different content in TEI and TEI.ana versions

  • different content TEI vs TEI.ana

I checked the number of <vocal> elements in ParlaMint-FI_2015-05-22-ps-7.ana.xml (cnt=1) and ParlaMint-FI_2015-05-22-ps-7.xml (cnt=3)

missing annotation when notes or interruptions

  • missing linguistics annotations

I guess this can be related to the previous issue.

missing join="right"

  • missing join="right"

When space is not present after token (<w>/<pc>) attrinute join="right" is required.

additional | character

  • additional | character in msd attribute
<pc xml:id="ParlaMint-FI_2015-05-22-ps-7.seg24.7.157" msd="UPosTag=PUNCT|">.</ns0:pc>

should be

<pc xml:id="ParlaMint-FI_2015-05-22-ps-7.seg24.7.157" msd="UPosTag=PUNCT">.</pc>

to date before from date

  • from < to

https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L582-L584

                  <event from="2018-12-06" to="2018-06-17">
                     <label xml:lang="en">existence</label>
                  </event>

Suspiciously short life of parliamentary groups

  • Suspiciously short life of parliamentary groups

https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L564

                  <event from="2020-06-05" to="2020-06-09">
                     <label xml:lang="en">existence</label>
                  </event>
@matyaskopp matyaskopp linked a pull request May 31, 2023 that will close this issue
@TomazErjavec TomazErjavec added this to the ParlaMint 3.1 release milestone Jun 1, 2023
@TomazErjavec
Copy link
Collaborator

As not sure FI will be available for 3.0, setting this to 3.1 milestone. If done before that is of course great.

@yoge1
Copy link
Collaborator

yoge1 commented Jun 27, 2023

additional | character

Task done in f477b81

@yoge1
Copy link
Collaborator

yoge1 commented Jun 27, 2023

missing join="right"

Task done in a084340

@yoge1
Copy link
Collaborator

yoge1 commented Jun 27, 2023

missing terms in data

Component files meeting element

Tasks under both headings done in 7c539a7

@matyaskopp Now we have in tei corpus root file information on parliamentary terms/legislative periods/electoral terms instead of parliamentary sessions (which we previously had). Note that we don't have full coverage for the latter 4-year term 2019 (-2023), so I hope it's not misleading to have a meeting element for that term in the corpus root file (we have full coverage for the parliamentary sessions we previously had as meeting elements).

@yoge1
Copy link
Collaborator

yoge1 commented Jun 28, 2023

to date before from date

Task done in 6682e64

@yoge1
Copy link
Collaborator

yoge1 commented Jun 28, 2023

Suspiciously short life of parliamentary groups

For the particular parliamentary group example you provided, the lifetime is valid (it comes straight from Parliament of Finland's open data service).
https://github.com/SemanticComputing/ParlaMint/blob/9409cc2b77ca36f6ac9be7e83cf9f5d917cf8714/Data/ParlaMint-FI/ParlaMint-FI.xml#L564

@yoge1
Copy link
Collaborator

yoge1 commented Sep 1, 2023

Different content in TEI and TEI.ana versions

Fix (not 100%) for aligning TEI and TEI.ana segments in f613e61

@TomazErjavec
Copy link
Collaborator

What is to happen with this feedback? Close it? Move it to Future?

@TomazErjavec
Copy link
Collaborator

No comment on my comment. Moving this to Future.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging a pull request may close this issue.

3 participants