Skip to content

Commit f0455ef

Browse files
committed
Changing data folder structure
1 parent ec06257 commit f0455ef

34 files changed

+556
-20
lines changed

score.py score_test.py

+17-5
Original file line numberDiff line numberDiff line change
@@ -81,8 +81,9 @@ def update(dict_1, dict_2):
8181
submit = os.path.join(sys.argv[1], 'res')
8282
output = sys.argv[2]
8383
else:
84-
gold = 'gold'
85-
submit = 'submit'
84+
print('(!) Using `trial/submit` as test files and `trial/gold` as reference files.')
85+
gold = 'trial/gold'
86+
submit = 'trial/submit'
8687
output = '.'
8788

8889
totals1 = collections.defaultdict(lambda: 0)
@@ -102,9 +103,9 @@ def update(dict_1, dict_2):
102103
scenario3 = evaluate_3(name, gold, submit)
103104
update(scenario3, totals3)
104105

105-
pprint.pprint(('Scenario 1', totals1))
106-
pprint.pprint(('Scenario 2', totals2))
107-
pprint.pprint(('Scenario 3', totals3))
106+
# pprint.pprint(('Scenario 1', totals1))
107+
# pprint.pprint(('Scenario 2', totals2))
108+
# pprint.pprint(('Scenario 3', totals3))
108109

109110
correct_1 = sum([totals1['correct_A'], totals1['correct_B'], totals1['correct_C'], 0.5 * totals1['partial_A']])
110111
subtotal_1 = sum([totals1['partial_A'], totals1['correct_A'], totals1['correct_B'], totals1['incorrect_B'], totals1['correct_C']])
@@ -129,6 +130,17 @@ def update(dict_1, dict_2):
129130

130131
macro = sum([abc_f1, bc_f1, c_f1]) / 3
131132

133+
print('abc_prec:%.5f' % abc_prec)
134+
print('abc_rec:%.5f' % abc_rec)
135+
print('abc_f1:%.5f' % abc_f1)
136+
print('bc_prec:%.5f' % bc_prec)
137+
print('bc_rec:%.5f' % bc_rec)
138+
print('bc_f1:%.5f' % bc_f1)
139+
print('c_prec:%.5f' % c_prec)
140+
print('c_rec:%.5f' % c_rec)
141+
print('c_f1:%.5f' % c_f1)
142+
print('macro:%.5f' % macro)
143+
132144
with open(os.path.join(output, 'scores.txt'), 'w') as fp:
133145
fp.write('abc_prec:%.5f\n'% abc_prec)
134146
fp.write('abc_rec:%.5f\n' % abc_rec)

evaluate.py score_training.py

+11-15
Original file line numberDiff line numberDiff line change
@@ -167,13 +167,10 @@ def evaluate_links(gold_links_file, dev_links_file, sentences, gold_phrases, dev
167167
print("F1: %.2f" % f1)
168168

169169

170-
def evaluate(file):
171-
gold = sys.argv[1] if len(sys.argv) > 1 else "gold"
172-
dev = sys.argv[2] if len(sys.argv) > 2 else "dev"
173-
174-
input_file = abspath(join(gold, 'input_%s.txt' % file))
175-
gold_phrases_file = abspath(join(gold, 'output_A_%s.txt' % file))
176-
dev_phrases_file = abspath(join(dev, 'output_A_%s.txt' % file))
170+
def evaluate(file, folder):
171+
input_file = abspath(join(folder, 'input', 'input_%s.txt' % file))
172+
gold_phrases_file = abspath(join(folder, 'gold', 'output_A_%s.txt' % file))
173+
dev_phrases_file = abspath(join(folder, 'dev', 'output_A_%s.txt' % file))
177174

178175
if not exists(input_file):
179176
raise ValueError("Input file '%s' not found." % input_file)
@@ -186,8 +183,8 @@ def evaluate(file):
186183

187184
l = evaluate_phrases(input_file, gold_phrases_file, dev_phrases_file)
188185

189-
gold_labels_file = abspath(join(gold, 'output_B_%s.txt' % file))
190-
dev_labels_file = abspath(join(dev, 'output_B_%s.txt' % file))
186+
gold_labels_file = abspath(join(folder, 'gold', 'output_B_%s.txt' % file))
187+
dev_labels_file = abspath(join(folder, 'dev', 'output_B_%s.txt' % file))
191188

192189
if not exists(gold_labels_file):
193190
raise ValueError("Gold phrases file '%s' not found." % gold_phrases_file)
@@ -197,8 +194,8 @@ def evaluate(file):
197194
else:
198195
evaluate_labels(gold_labels_file, dev_labels_file, *l)
199196

200-
ref_links_file = abspath(join(gold, 'output_C_%s.txt' % file))
201-
eval_links_file = abspath(join(dev, 'output_C_%s.txt' % file))
197+
ref_links_file = abspath(join(folder, 'gold', 'output_C_%s.txt' % file))
198+
eval_links_file = abspath(join(folder, 'dev', 'output_C_%s.txt' % file))
202199

203200
if not exists(eval_links_file):
204201
print("\n(!) Skipping Task C: file '%s' not found. Assuming task is not completed yet." % eval_links_file)
@@ -207,9 +204,8 @@ def evaluate(file):
207204

208205

209206
if __name__ == '__main__':
210-
gold = sys.argv[1] if len(sys.argv) > 1 else "gold"
211-
dev = sys.argv[2] if len(sys.argv) > 2 else "dev"
207+
folder = sys.argv[1] if len(sys.argv) > 1 else "training"
212208

213-
for fname in os.listdir(gold):
209+
for fname in os.listdir(os.path.join(folder, 'input')):
214210
if fname.startswith("input_"):
215-
evaluate(fname[6:-4])
211+
evaluate(fname[6:-4], folder)
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.

test/submit/scenario2-BC/.gitkeep

Whitespace-only changes.

test/submit/scenario3-C/.gitkeep

Whitespace-only changes.

training/dev/.gitkeep

Whitespace-only changes.

training/gold/.gitkeep

Whitespace-only changes.

training/input/.gitkeep

Whitespace-only changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
File renamed without changes.
+31
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,31 @@
1+
Un aborto es un procedimiento para interrumpir un embarazo.
2+
Se utilizan medicinas o cirugía para retirar el embrión o el feto y la placenta del útero.
3+
El procedimiento es realizado por un profesional de la salud con licencia.
4+
La decisión de interrumpir un embarazo es muy personal.
5+
Si piensa someterse a un aborto, la mayoría de los profesionales de la salud sugieren asesoría psicológica.
6+
7+
La adopción lleva un hijo nacido de unos padres, a una nueva familia.
8+
Los padres naturales pueden tener muchos motivos para dar a sus hijos en adopción.
9+
Al final, suele ser porque desean una vida para sus niños que sea mejor que la que ellos pudieran ofrecerles.
10+
Los niños elegibles para ser adoptados provienen de muchos entornos distintos.
11+
Algunos están en hogares sustitutos, que son hogares temporales.
12+
Otros niños viven en orfanatos o con familiares naturales, hasta que puedan ser adoptados.
13+
Existen diferentes tipos de adopción.
14+
Si la adopción es internacional o nacional, dependerá si el niño nació dentro de los Estados Unidos o no.
15+
16+
El cáncer comienza en las células, que constituyen los ladrillos del cuerpo.
17+
Normalmente, el cuerpo forma células nuevas a medida que se necesitan para reemplazar a las células envejecidas que mueren.
18+
Algunas veces, este proceso no resulta ser el esperado.
19+
Crecen células nuevas que no son necesarias y las células envejecidas no mueren cuando deberían.
20+
Estas células adicionales pueden formar una masa llamada tumor.
21+
Los tumores pueden ser benignos o malignos. Los tumores benignos no son cáncer, mientras que los malignos sí lo son.
22+
Las células de los tumores malignos pueden invadir los tejidos cercanos.
23+
También pueden desprenderse y diseminarse a otras partes del cuerpo.
24+
El cáncer no es solo una enfermedad, sino varias.
25+
Existen más de 100 tipos de cáncer.
26+
La mayoría de éstos se nombran por su lugar de origen.
27+
Por ejemplo, el cáncer de pulmón comienza en el pulmón y el cáncer de seno comienza en el seno.
28+
La diseminación de un cáncer desde una parte del cuerpo a otra se denomina metástasis.
29+
Los síntomas y el tratamiento dependen del tipo de cáncer y de lo avanzada que esté la enfermedad.
30+
La mayoría de los tratamientos incluye cirugía, radiación y/o quimioterapia.
31+
Algunos pueden también incluir terapia hormonal, inmunoterapia u otros tipos de terapia biológica, o trasplante de células madre.
+31
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,31 @@
1+
Un aborto es un procedimiento para interrumpir un embarazo.
2+
Se utilizan medicinas o cirugía para retirar el embrión o el feto y la placenta del útero.
3+
El procedimiento es realizado por un profesional de la salud con licencia.
4+
La decisión de interrumpir un embarazo es muy personal.
5+
Si piensa someterse a un aborto, la mayoría de los profesionales de la salud sugieren asesoría psicológica.
6+
7+
La adopción lleva un hijo nacido de unos padres, a una nueva familia.
8+
Los padres naturales pueden tener muchos motivos para dar a sus hijos en adopción.
9+
Al final, suele ser porque desean una vida para sus niños que sea mejor que la que ellos pudieran ofrecerles.
10+
Los niños elegibles para ser adoptados provienen de muchos entornos distintos.
11+
Algunos están en hogares sustitutos, que son hogares temporales.
12+
Otros niños viven en orfanatos o con familiares naturales, hasta que puedan ser adoptados.
13+
Existen diferentes tipos de adopción.
14+
Si la adopción es internacional o nacional, dependerá si el niño nació dentro de los Estados Unidos o no.
15+
16+
El cáncer comienza en las células, que constituyen los ladrillos del cuerpo.
17+
Normalmente, el cuerpo forma células nuevas a medida que se necesitan para reemplazar a las células envejecidas que mueren.
18+
Algunas veces, este proceso no resulta ser el esperado.
19+
Crecen células nuevas que no son necesarias y las células envejecidas no mueren cuando deberían.
20+
Estas células adicionales pueden formar una masa llamada tumor.
21+
Los tumores pueden ser benignos o malignos. Los tumores benignos no son cáncer, mientras que los malignos sí lo son.
22+
Las células de los tumores malignos pueden invadir los tejidos cercanos.
23+
También pueden desprenderse y diseminarse a otras partes del cuerpo.
24+
El cáncer no es solo una enfermedad, sino varias.
25+
Existen más de 100 tipos de cáncer.
26+
La mayoría de éstos se nombran por su lugar de origen.
27+
Por ejemplo, el cáncer de pulmón comienza en el pulmón y el cáncer de seno comienza en el seno.
28+
La diseminación de un cáncer desde una parte del cuerpo a otra se denomina metástasis.
29+
Los síntomas y el tratamiento dependen del tipo de cáncer y de lo avanzada que esté la enfermedad.
30+
La mayoría de los tratamientos incluye cirugía, radiación y/o quimioterapia.
31+
Algunos pueden también incluir terapia hormonal, inmunoterapia u otros tipos de terapia biológica, o trasplante de células madre.
+31
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,31 @@
1+
Un aborto es un procedimiento para interrumpir un embarazo.
2+
Se utilizan medicinas o cirugía para retirar el embrión o el feto y la placenta del útero.
3+
El procedimiento es realizado por un profesional de la salud con licencia.
4+
La decisión de interrumpir un embarazo es muy personal.
5+
Si piensa someterse a un aborto, la mayoría de los profesionales de la salud sugieren asesoría psicológica.
6+
7+
La adopción lleva un hijo nacido de unos padres, a una nueva familia.
8+
Los padres naturales pueden tener muchos motivos para dar a sus hijos en adopción.
9+
Al final, suele ser porque desean una vida para sus niños que sea mejor que la que ellos pudieran ofrecerles.
10+
Los niños elegibles para ser adoptados provienen de muchos entornos distintos.
11+
Algunos están en hogares sustitutos, que son hogares temporales.
12+
Otros niños viven en orfanatos o con familiares naturales, hasta que puedan ser adoptados.
13+
Existen diferentes tipos de adopción.
14+
Si la adopción es internacional o nacional, dependerá si el niño nació dentro de los Estados Unidos o no.
15+
16+
El cáncer comienza en las células, que constituyen los ladrillos del cuerpo.
17+
Normalmente, el cuerpo forma células nuevas a medida que se necesitan para reemplazar a las células envejecidas que mueren.
18+
Algunas veces, este proceso no resulta ser el esperado.
19+
Crecen células nuevas que no son necesarias y las células envejecidas no mueren cuando deberían.
20+
Estas células adicionales pueden formar una masa llamada tumor.
21+
Los tumores pueden ser benignos o malignos. Los tumores benignos no son cáncer, mientras que los malignos sí lo son.
22+
Las células de los tumores malignos pueden invadir los tejidos cercanos.
23+
También pueden desprenderse y diseminarse a otras partes del cuerpo.
24+
El cáncer no es solo una enfermedad, sino varias.
25+
Existen más de 100 tipos de cáncer.
26+
La mayoría de éstos se nombran por su lugar de origen.
27+
Por ejemplo, el cáncer de pulmón comienza en el pulmón y el cáncer de seno comienza en el seno.
28+
La diseminación de un cáncer desde una parte del cuerpo a otra se denomina metástasis.
29+
Los síntomas y el tratamiento dependen del tipo de cáncer y de lo avanzada que esté la enfermedad.
30+
La mayoría de los tratamientos incluye cirugía, radiación y/o quimioterapia.
31+
Algunos pueden también incluir terapia hormonal, inmunoterapia u otros tipos de terapia biológica, o trasplante de células madre.
+145
Original file line numberDiff line numberDiff line change
@@ -0,0 +1,145 @@
1+
1 35 46
2+
2 50 58
3+
3 3 9
4+
5 72 81
5+
6 84 91
6+
7 108 115
7+
8 121 125
8+
9 131 139
9+
10 144 149
10+
11 97 104
11+
12 63 71
12+
13 188 199
13+
15 171 180
14+
16 154 167
15+
17 216 224
16+
18 256 264
17+
19 241 252
18+
20 272 280
19+
21 229 237
20+
22 368 376
21+
24 333 346
22+
26 307 313
23+
27 292 301
24+
28 359 367
25+
29 285 291
26+
30 394 402
27+
31 412 416
28+
32 417 423
29+
33 432 438
30+
34 452 459
31+
35 446 451
32+
36 403 408
33+
37 465 471
34+
39 515 518
35+
40 525 530
36+
41 534 542
37+
42 489 494
38+
43 502 509
39+
44 658 663
40+
45 713 721
41+
46 722 731
42+
48 693 702
43+
49 750 768
44+
50 778 796
45+
51 804 809
46+
52 819 828
47+
53 810 815
48+
54 835 845
49+
55 874 877
50+
56 878 887
51+
57 917 925
52+
58 908 913
53+
59 933 941
54+
60 945 958
55+
61 961 969
56+
62 1012 1026
57+
63 987 991
58+
64 992 997
59+
65 971 980
60+
66 1037 1043
61+
67 1044 1052
62+
68 1060 1067
63+
71 1103 1109
64+
70 1127 1133
65+
72 1140 1147
66+
73 1140 1154
67+
74 1134 1139
68+
75 1203 1210
69+
76 1203 1222
70+
77 1227 1233
71+
78 1186 1196
72+
79 1364 1370
73+
80 1298 1305
74+
81 1306 1312
75+
82 1320 1323
76+
83 1324 1334
77+
84 1341 1348
78+
85 1349 1360
79+
86 1291 1297
80+
87 1421 1427
81+
88 1432 1436
82+
89 1445 1450
83+
90 1394 1401
84+
93 1475 1483
85+
94 1486 1494
86+
92 1456 1463
87+
96 1520 1523
88+
97 1524 1530
89+
98 1549 1557
90+
101 1612 1619
91+
102 1573 1580
92+
103 1624 1631
93+
108 1885 1893
94+
109 1900 1906
95+
110 1942 1946
96+
112 1927 1935
97+
113 1912 1918
98+
115 1868 1874
99+
116 1951 1963
100+
117 1970 1976
101+
118 2023 2033
102+
121 2122 2132
103+
122 2039 2047
104+
123 2053 2064
105+
124 2065 2073
106+
126 2152 2164
107+
127 2165 2172
108+
128 2173 2180
109+
129 2182 2191
110+
130 2196 2209
111+
131 2234 2241
112+
132 2242 2258
113+
133 2260 2273
114+
134 2291 2308
115+
135 2312 2322
116+
136 2326 2339
117+
137 368 388
118+
4 16 29
119+
14 188 211
120+
23 465 481
121+
38 741 746
122+
114 1868 1884
123+
111 1912 1926
124+
138 2291 2298
125+
139 2282 2287
126+
140 2242 2249
127+
141 778 785
128+
142 750 757
129+
143 333 358
130+
25 706 712
131+
69 664 673
132+
144 683 692
133+
47 733 740
134+
145 846 855
135+
91 1402 1413
136+
146 1500 1507
137+
95 1500 1516
138+
99 1588 1595
139+
147 1588 1604
140+
100 1632 1640
141+
104 2014 2022
142+
105 2086 2092
143+
106 2078 2082
144+
107 2101 2109
145+
119 2326 2333

0 commit comments

Comments
 (0)