Skip to content

ES Feedback #696

Open
Open
@matyaskopp

Description

@matyaskopp

@charlicruz, @calzada

Improve note annotations

  • notes

eg:

<note>Aplausos</note>

should be

<kinesic type="applause">
 <desc>Aplausos</desc>
</kinesic>

most common notes with frequencies:

  21339 <note>Aplausos</note>
   4356 <note>Rumores</note>
   3777 <note>Pausa</note>
   1629 <note>Pausa.-Una trabajadora del servicio de limpieza procede a desinfectar la tribuna de oradores</note>
    698 <note>aplausos</note>
    629 <note>EAJ-PNV</note>
    568 <note>Risas</note>
    448 <note>Protestas</note>
    326 <note>rumores</note>
    305 <note>Aplausos.-Rumores</note>
    261 <note>Rumores.-Aplausos</note>
    245 <note>Aplausos.</note>
    215 <note>La señora presidenta ocupa la Presidencia</note>
    173 <note>Continúan los rumores</note>
    161 <note>El señor vicepresidente, Prendes Prendes, ocupa la Presidencia</note>
    146 <note>Asentimiento</note>
    144 <note>Risas.-Aplausos</note>
    143 <note>Protestas.-Aplausos</note>
    136 <note>Convergència i Unió</note>
    127 <note>Risas y aplausos</note>
    123 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario VOX, puestos en pie</note>
    119 <note>Pausa.-Una trabajadora del servicio de limpieza procede a desinfectar la tribuna de oradores.</note>
    111 <note>Prolongados aplausos</note>
    101 <note>Muestra un documento</note>
     96 <note>Aplausos.-Protestas</note>
     92 <note>La señora vicepresidenta, Navarro Garzón, ocupa la Presidencia</note>
     90 <note>La señora vicepresidenta, Villalobos Talero, ocupa la Presidencia</note>
     88 <note>El señor presidente ocupa la Presidencia</note>
     82 <note>Varios señores diputados: ¡Muy bien!-Aplausos</note>
     80 <note>Rumores y protestas</note>
     78 <note>risas</note>
     78 <note>protestas</note>
     63 <note>nueva</note>
     63 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario Confederal de Unidos Podemos-En Comú Podem-En Marea, puestos en pie</note>
     62 <note>Una trabajadora del servicio de limpieza procede a desinfectar la tribuna de oradores</note>
     60 <note>Rumores.-Protestas</note>
     59 <note>El señor vicepresidente, Rodríguez Gómez de Celis, ocupa la Presidencia</note>
     57 <note>Aplausos.-Varios señores diputados: ¡Muy bien!</note>
     52 <note>Risas.-Rumores</note>
     51 <note>Muestra un gráfico</note>
     47 <note>PNV</note>
     46 <note>Pausa.</note>
     46 <note>muestra un documento</note>
     46 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario Ciudadanos, puestos en pie</note>
     41 <note>Muestra una fotografía</note>
     40 <note>Varias señoras y señores diputados: ¡Muy bien!-Aplausos</note>
     40 <note>Rumores.-Risas</note>
     38 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario Socialista, puestos en pie</note>
     37 <note>Un señor diputado: ¡Muy bien!-Aplausos</note>
     37 <note>nuevo</note>
     37 <note>Aplausos.-Un señor diputado: ¡Muy bien!</note>
     35 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario Popular en el Congreso, puestos en pie</note>
     34 <note>Democràcia i Llibertat</note>
     32 <note>Continúan las protestas</note>
     29 <note>El señor vicepresidente, Barrero López, ocupa la Presidencia</note>
     29 <note>CONVERGÈNCIA I UNIÓ</note>
     28 <note>La señora vicepresidenta, Montserrat Montserrat, ocupa la Presidencia</note>
     27 <note>La señora vicepresidenta, Elizo Serrano, ocupa la Presidencia</note>
     26 <note>Pausa. Una trabajadora del servicio de limpieza procede a desinfectar la tribuna de oradores</note>
     26 <note>Denegación</note>
     25 <note>Un señor diputado pronuncia palabras que no se perciben</note>
     25 <note>La señora vicepresidenta, Romero Sánchez, ocupa la Presidencia</note>
     23 <note>Pronuncia palabras en catalán</note>
     23 <note>muestra un gráfico</note>
     23 <note>Aplausos.-Risas</note>

Missing who when chair

  • chairman speeches

Missing who attribute
https://github.com/matyaskopp/PARLAMINT-ES-MC/blob/4dc6c5f53597e2bdc3b3925a4424cb38764a4931/ParlaMint.sample/ParlaMint-ES_2015-01-20-CD150120.xml#L100-L103

<u xml:id="ParlaMint-ES_2015-01-20-CD150120.u1" ana="#chair">
  <seg xml:id="ParlaMint-ES_2015-01-20-CD150120.u1.1">Se abre la sesión.</seg>
  <seg xml:id="ParlaMint-ES_2015-01-20-CD150120.u1.2">Convalidación o derogación del Real Decreto-ley 15/2014, de 19 de diciembre, de modificación del Régimen Económico y Fiscal de Canarias. Para presentar el real decreto-ley, tiene la palabra en nombre del Gobierno el ministro de Hacienda y Administraciones Públicas.</seg>
</u>

source:
https://github.com/matyaskopp/PARLAMINT-ES-MC/blob/4dc6c5f53597e2bdc3b3925a4424cb38764a4931/CD.sample/CD150120.xml#L57-L76

<speaker>
<name>UNKNOWN</name>
<birth_date>UNKNOWN</birth_date>
<birth_place country="ES">UNKNOWN</birth_place>
<status>NA</status>
<gender>UNKNOWN</gender>
<institution>
<ni country="ES">CD</ni>
</institution>
<constituency country="ES" region="UNKNOWN"/>
<affiliation>
<national_party>UNKNOWN</national_party>
<cd group="UNKNOWN"/>
</affiliation>
<post>PRESIDENTE</post>
</speaker>
<speech id="spXY" language="ES">
Se abre la sesión. 
Convalidación o derogación del Real Decreto-ley 15/2014, de 19 de diciembre, de modificación del Régimen Económico y Fiscal de Canarias. Para presentar el real decreto-ley, tiene la palabra en nombre del Gobierno el ministro de Hacienda y Administraciones Públicas. 
</speech>

chairman name is present in source file:
https://github.com/matyaskopp/PARLAMINT-ES-MC/blob/4dc6c5f53597e2bdc3b3925a4424cb38764a4931/CD.sample/CD150120.xml#L52

<body>
  <chair who="JESÚS POSADA MORENO">
    <!-- all speeches -->
  </chair>
</body>

list of chairmans with frequencies:

cat CD/*.xml|grep '<chair'|sed 's/^ *//;s/\r//'|sort|uniq -c|sort -nr
    208 <chair who="MERITXELL BATET LAMAÑA">
    161 <chair who="ANA MARÍA PASTOR JULIÁN">
     56 <chair who="JESÚS POSADA MORENO">
      8 <chair who="PATXI LÓPEZ ÁLVAREZ">
      5 <chair who="NA">
      5 <chair who="ALFONSO RODRÍGUEZ GÓMEZ DE CELIS">
      3 <chair who="PATXI LÓPEZ ÁLVAREZ ">
      2 <chair who="JOSÉ IGNACIO PRENDES PRENDES">
      1 <chair who="MERITXELL BATET LAMAÑA ">
      1 <chair who="CELIA VILLALOBOS TALERO VICEPRESIDENTA PRIMERA">

No guest speakers ???

  • guest speaker role

This is a bit strange. In ES parliament, there is no speaker labelled with guest category (ana="#guest")

Missing parliamentaryGroups

  • parliamentaryGroup

it seems that source data contain parliamentary groups. They are now required (https://clarin-eric.github.io/ParlaMint/#sec-parties) in ParlaMint (parties can be converted into groups or better, encode both party+groups)

ParlaMint requires that a corpus must use parliamentary groups, while the use of political parties is optional. Note that if political parties are used, it is also expected to encode which political parties constitute a parliamentary group; this is encoded via the element, as further explained in the Section on Relations between organisations.

list of parliamentary groups with number of affiliated persons

cat CD/*.xml|tr '\r\n' '  ' |sed 's/<speaker>/\n<speaker>/g;s/<\/speaker>/\n/g'|grep speaker |sed 's/^.*<name>//;s@</name.*group="@\t@;s@".*$@@;'|grep -v '<'|sort|uniq|cut -f 2|sort|uniq -c
     18 GC-CiU
      1 GC-DL
     48 GCs
     47 GCUP-EC-EM
     44 GCUP-EC-GC
      5 GEH Bildu
      5 GER
     13 GIP
     37 GMx
      1 GMX
    259 GP
     13 GPlu
     15 GR
    264 GS
      7 GUPyD
     10 GV (EAJ-PNV)
      1 GVox
     54 GVOX
     96 NA
     12 UNKNOWN

Parliamentary group - party pairs:

cat CD/*.xml|tr '\r\n' '  ' |sed 's/<speaker>/\n<speaker>/g;s/<\/speaker>/\n/g'|grep speaker |sed 's/^.*<national_party>//;s@</national_party.*group="@\t@;s@".*$@@;'|grep -v '<'|sort|uniq
AMAIUR	GMx
BNG	GMx
BNG	GPlu
CCa-PNC	GMx
CCa-PNC-NC	GMx
CC-NC-PNC	GMx
CDC	GMx
CiU	GC-CiU
COMPROMÍS-Q	GMx
C-P-EUPV	GCUP-EC-EM
C-P-EUPV	GMx
Cs	GCs
CUP-PR	GMx
DL	GC-DL
EAJ-PNV	GV (EAJ-PNV)
ECP	GCUP-EC-EM
ECP	GCUP-EC-GC
ECP-GUAYEM EL CANVI	GCUP-EC-GC
EC-UP	GCUP-EC-GC
EH Bildu	GEH Bildu
EH Bildu	GMx
EM-P-A-EU	GCUP-EC-EM
ERC-CATSÍ	GER
ERC-RI.cat	GMx
ERC-S	GR
EUiA	GIP
EUPV	GIP
GB	GMx
 GP	GP
ICV	GIP
IC-V	GMX
IZQ-PLU	GIP
JxCat-JUNTS	GPlu
JxCat-JUNTS(Junts)	GPlu
MÁS PAÍS-EQUO	GPlu
MÉS COMPROMÍS	GPlu
NA+	GMx
NA	NA
NC-CCa-PNC	GMx
PP-EU	GP
PP-FORO	GMx
PP-FORO	GP
PP	GP
PP-PAR	GP
PRC	GMx
PSC(PSC-PSOE)	GS
PSC-PSOE	GS
PsdeG-PSOE	GS
PSdeG-PSOE	GS
PSdG-PSOE	GS
PSE-EE-PSOE	GS
PSOEdeAndalucía	GS
PSOE	GS
PSOE	NA
PSOE-NCa	GS
¡Teruel Existe!	GMx
UNKNOWN	UNKNOWN
UP	GCUP-EC-EM
UP	GCUP-EC-GC
UPM	GCUP-EC-EM
UPN	GMx
UPN-PP	GMx
UPyD	GUPyD
Vox	GVox
Vox	GVOX

Missing translation

  • translation

https://github.com/matyaskopp/ParlaMint/blob/e48f74e3c66adb5a32b8d1051be3d2ebb58c097c/Data/ParlaMint-ES/ParlaMint-taxonomy-parla.legislature.xml#L200-L207

                  <category xml:id="parla.meeting.ceremonial">
                     <catDesc xml:lang="es">
                        <term>--</term>
                     </catDesc>
                     <catDesc xml:lang="en">
                        <term>Ceremonial meeting</term>
                     </catDesc>
                  </category>

parliamentaryGroup affiliation overlaps

  • overlapping parliamentaryGroup (party) affiliations

I have discovered this accidentally because it produces a different error:

Error: ERROR: multiple party statuses for MartínezMaría on 2021-01-28: Coalition Opposition

   <person xml:id="MartínezMaría">
      <persName>
         <forename>María</forename>
         <forename>Luz</forename>
         <surname>Martínez</surname>
         <surname>Seijo</surname>
      </persName>
      <sex value="F"/>
      <birth when="1968-11-10"/>
      <affiliation ref="#CD" role="member" from="2016-04-19" to="2023-02-14"/>
      <affiliation role="member" ref="#party.Cs" from="2020-02-11" to="2023-02-14"/>
      <affiliation role="member" ref="#party.PP" from="2018-06-19" to="2022-12-21"/>
      <affiliation role="member"
                   ref="#party.PSOE"
                   from="2016-04-19"
                   to="2021-12-15"/>
      <affiliation role="member" ref="#party.UP" from="2016-12-13" to="2019-02-13"/>
   </person>

for this error, there can be many reasons:

  • MartínezMaría migrates between parties a lot (embodied multiple times to a single party) - the script is not able to deal with it
  • there is a namesake
  • bug in source data

Metadata

Metadata

Assignees

No one assigned

    Labels

    No labels
    No labels

    Type

    No type

    Projects

    No projects

    Relationships

    None yet

    Development

    No branches or pull requests

    Issue actions