Description
Improve note annotations
- notes
eg:
<note>Aplausos</note>
should be
<kinesic type="applause">
<desc>Aplausos</desc>
</kinesic>
most common notes with frequencies:
21339 <note>Aplausos</note>
4356 <note>Rumores</note>
3777 <note>Pausa</note>
1629 <note>Pausa.-Una trabajadora del servicio de limpieza procede a desinfectar la tribuna de oradores</note>
698 <note>aplausos</note>
629 <note>EAJ-PNV</note>
568 <note>Risas</note>
448 <note>Protestas</note>
326 <note>rumores</note>
305 <note>Aplausos.-Rumores</note>
261 <note>Rumores.-Aplausos</note>
245 <note>Aplausos.</note>
215 <note>La señora presidenta ocupa la Presidencia</note>
173 <note>Continúan los rumores</note>
161 <note>El señor vicepresidente, Prendes Prendes, ocupa la Presidencia</note>
146 <note>Asentimiento</note>
144 <note>Risas.-Aplausos</note>
143 <note>Protestas.-Aplausos</note>
136 <note>Convergència i Unió</note>
127 <note>Risas y aplausos</note>
123 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario VOX, puestos en pie</note>
119 <note>Pausa.-Una trabajadora del servicio de limpieza procede a desinfectar la tribuna de oradores.</note>
111 <note>Prolongados aplausos</note>
101 <note>Muestra un documento</note>
96 <note>Aplausos.-Protestas</note>
92 <note>La señora vicepresidenta, Navarro Garzón, ocupa la Presidencia</note>
90 <note>La señora vicepresidenta, Villalobos Talero, ocupa la Presidencia</note>
88 <note>El señor presidente ocupa la Presidencia</note>
82 <note>Varios señores diputados: ¡Muy bien!-Aplausos</note>
80 <note>Rumores y protestas</note>
78 <note>risas</note>
78 <note>protestas</note>
63 <note>nueva</note>
63 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario Confederal de Unidos Podemos-En Comú Podem-En Marea, puestos en pie</note>
62 <note>Una trabajadora del servicio de limpieza procede a desinfectar la tribuna de oradores</note>
60 <note>Rumores.-Protestas</note>
59 <note>El señor vicepresidente, Rodríguez Gómez de Celis, ocupa la Presidencia</note>
57 <note>Aplausos.-Varios señores diputados: ¡Muy bien!</note>
52 <note>Risas.-Rumores</note>
51 <note>Muestra un gráfico</note>
47 <note>PNV</note>
46 <note>Pausa.</note>
46 <note>muestra un documento</note>
46 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario Ciudadanos, puestos en pie</note>
41 <note>Muestra una fotografía</note>
40 <note>Varias señoras y señores diputados: ¡Muy bien!-Aplausos</note>
40 <note>Rumores.-Risas</note>
38 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario Socialista, puestos en pie</note>
37 <note>Un señor diputado: ¡Muy bien!-Aplausos</note>
37 <note>nuevo</note>
37 <note>Aplausos.-Un señor diputado: ¡Muy bien!</note>
35 <note>Aplausos de las señoras y los señores diputados del Grupo Parlamentario Popular en el Congreso, puestos en pie</note>
34 <note>Democràcia i Llibertat</note>
32 <note>Continúan las protestas</note>
29 <note>El señor vicepresidente, Barrero López, ocupa la Presidencia</note>
29 <note>CONVERGÈNCIA I UNIÓ</note>
28 <note>La señora vicepresidenta, Montserrat Montserrat, ocupa la Presidencia</note>
27 <note>La señora vicepresidenta, Elizo Serrano, ocupa la Presidencia</note>
26 <note>Pausa. Una trabajadora del servicio de limpieza procede a desinfectar la tribuna de oradores</note>
26 <note>Denegación</note>
25 <note>Un señor diputado pronuncia palabras que no se perciben</note>
25 <note>La señora vicepresidenta, Romero Sánchez, ocupa la Presidencia</note>
23 <note>Pronuncia palabras en catalán</note>
23 <note>muestra un gráfico</note>
23 <note>Aplausos.-Risas</note>
Missing who when chair
- chairman speeches
Missing who
attribute
https://github.com/matyaskopp/PARLAMINT-ES-MC/blob/4dc6c5f53597e2bdc3b3925a4424cb38764a4931/ParlaMint.sample/ParlaMint-ES_2015-01-20-CD150120.xml#L100-L103
<u xml:id="ParlaMint-ES_2015-01-20-CD150120.u1" ana="#chair">
<seg xml:id="ParlaMint-ES_2015-01-20-CD150120.u1.1">Se abre la sesión.</seg>
<seg xml:id="ParlaMint-ES_2015-01-20-CD150120.u1.2">Convalidación o derogación del Real Decreto-ley 15/2014, de 19 de diciembre, de modificación del Régimen Económico y Fiscal de Canarias. Para presentar el real decreto-ley, tiene la palabra en nombre del Gobierno el ministro de Hacienda y Administraciones Públicas.</seg>
</u>
<speaker>
<name>UNKNOWN</name>
<birth_date>UNKNOWN</birth_date>
<birth_place country="ES">UNKNOWN</birth_place>
<status>NA</status>
<gender>UNKNOWN</gender>
<institution>
<ni country="ES">CD</ni>
</institution>
<constituency country="ES" region="UNKNOWN"/>
<affiliation>
<national_party>UNKNOWN</national_party>
<cd group="UNKNOWN"/>
</affiliation>
<post>PRESIDENTE</post>
</speaker>
<speech id="spXY" language="ES">
Se abre la sesión.
Convalidación o derogación del Real Decreto-ley 15/2014, de 19 de diciembre, de modificación del Régimen Económico y Fiscal de Canarias. Para presentar el real decreto-ley, tiene la palabra en nombre del Gobierno el ministro de Hacienda y Administraciones Públicas.
</speech>
chairman name is present in source file:
https://github.com/matyaskopp/PARLAMINT-ES-MC/blob/4dc6c5f53597e2bdc3b3925a4424cb38764a4931/CD.sample/CD150120.xml#L52
<body>
<chair who="JESÚS POSADA MORENO">
<!-- all speeches -->
</chair>
</body>
list of chairmans with frequencies:
cat CD/*.xml|grep '<chair'|sed 's/^ *//;s/\r//'|sort|uniq -c|sort -nr
208 <chair who="MERITXELL BATET LAMAÑA">
161 <chair who="ANA MARÍA PASTOR JULIÁN">
56 <chair who="JESÚS POSADA MORENO">
8 <chair who="PATXI LÓPEZ ÁLVAREZ">
5 <chair who="NA">
5 <chair who="ALFONSO RODRÍGUEZ GÓMEZ DE CELIS">
3 <chair who="PATXI LÓPEZ ÁLVAREZ ">
2 <chair who="JOSÉ IGNACIO PRENDES PRENDES">
1 <chair who="MERITXELL BATET LAMAÑA ">
1 <chair who="CELIA VILLALOBOS TALERO VICEPRESIDENTA PRIMERA">
No guest speakers ???
- guest speaker role
This is a bit strange. In ES parliament, there is no speaker labelled with guest
category (ana="#guest"
)
Missing parliamentaryGroups
-
parliamentaryGroup
it seems that source data contain parliamentary groups. They are now required (https://clarin-eric.github.io/ParlaMint/#sec-parties) in ParlaMint (parties can be converted into groups or better, encode both party+groups)
ParlaMint requires that a corpus must use parliamentary groups, while the use of political parties is optional. Note that if political parties are used, it is also expected to encode which political parties constitute a parliamentary group; this is encoded via the element, as further explained in the Section on Relations between organisations.
list of parliamentary groups with number of affiliated persons
cat CD/*.xml|tr '\r\n' ' ' |sed 's/<speaker>/\n<speaker>/g;s/<\/speaker>/\n/g'|grep speaker |sed 's/^.*<name>//;s@</name.*group="@\t@;s@".*$@@;'|grep -v '<'|sort|uniq|cut -f 2|sort|uniq -c
18 GC-CiU
1 GC-DL
48 GCs
47 GCUP-EC-EM
44 GCUP-EC-GC
5 GEH Bildu
5 GER
13 GIP
37 GMx
1 GMX
259 GP
13 GPlu
15 GR
264 GS
7 GUPyD
10 GV (EAJ-PNV)
1 GVox
54 GVOX
96 NA
12 UNKNOWN
Parliamentary group - party pairs:
cat CD/*.xml|tr '\r\n' ' ' |sed 's/<speaker>/\n<speaker>/g;s/<\/speaker>/\n/g'|grep speaker |sed 's/^.*<national_party>//;s@</national_party.*group="@\t@;s@".*$@@;'|grep -v '<'|sort|uniq
AMAIUR GMx
BNG GMx
BNG GPlu
CCa-PNC GMx
CCa-PNC-NC GMx
CC-NC-PNC GMx
CDC GMx
CiU GC-CiU
COMPROMÍS-Q GMx
C-P-EUPV GCUP-EC-EM
C-P-EUPV GMx
Cs GCs
CUP-PR GMx
DL GC-DL
EAJ-PNV GV (EAJ-PNV)
ECP GCUP-EC-EM
ECP GCUP-EC-GC
ECP-GUAYEM EL CANVI GCUP-EC-GC
EC-UP GCUP-EC-GC
EH Bildu GEH Bildu
EH Bildu GMx
EM-P-A-EU GCUP-EC-EM
ERC-CATSÍ GER
ERC-RI.cat GMx
ERC-S GR
EUiA GIP
EUPV GIP
GB GMx
GP GP
ICV GIP
IC-V GMX
IZQ-PLU GIP
JxCat-JUNTS GPlu
JxCat-JUNTS(Junts) GPlu
MÁS PAÍS-EQUO GPlu
MÉS COMPROMÍS GPlu
NA+ GMx
NA NA
NC-CCa-PNC GMx
PP-EU GP
PP-FORO GMx
PP-FORO GP
PP GP
PP-PAR GP
PRC GMx
PSC(PSC-PSOE) GS
PSC-PSOE GS
PsdeG-PSOE GS
PSdeG-PSOE GS
PSdG-PSOE GS
PSE-EE-PSOE GS
PSOEdeAndalucía GS
PSOE GS
PSOE NA
PSOE-NCa GS
¡Teruel Existe! GMx
UNKNOWN UNKNOWN
UP GCUP-EC-EM
UP GCUP-EC-GC
UPM GCUP-EC-EM
UPN GMx
UPN-PP GMx
UPyD GUPyD
Vox GVox
Vox GVOX
Missing translation
- translation
<category xml:id="parla.meeting.ceremonial">
<catDesc xml:lang="es">
<term>--</term>
</catDesc>
<catDesc xml:lang="en">
<term>Ceremonial meeting</term>
</catDesc>
</category>
parliamentaryGroup affiliation overlaps
- overlapping parliamentaryGroup (party) affiliations
I have discovered this accidentally because it produces a different error:
Error: ERROR: multiple party statuses for MartínezMaría on 2021-01-28: Coalition Opposition
<person xml:id="MartínezMaría">
<persName>
<forename>María</forename>
<forename>Luz</forename>
<surname>Martínez</surname>
<surname>Seijo</surname>
</persName>
<sex value="F"/>
<birth when="1968-11-10"/>
<affiliation ref="#CD" role="member" from="2016-04-19" to="2023-02-14"/>
<affiliation role="member" ref="#party.Cs" from="2020-02-11" to="2023-02-14"/>
<affiliation role="member" ref="#party.PP" from="2018-06-19" to="2022-12-21"/>
<affiliation role="member"
ref="#party.PSOE"
from="2016-04-19"
to="2021-12-15"/>
<affiliation role="member" ref="#party.UP" from="2016-12-13" to="2019-02-13"/>
</person>
for this error, there can be many reasons:
MartínezMaría
migrates between parties a lot (embodied multiple times to a single party) - the script is not able to deal with it- there is a namesake
- bug in source data