Skip to content

Commit 401effc

Browse files
Added semi supervised learning #18
1 parent 89305ba commit 401effc

14 files changed

+124
-64
lines changed

Report/bibliografia.bib

Lines changed: 20 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -127,4 +127,24 @@ @article{li2002unsupervised
127127
pages={673--690},
128128
year={2002},
129129
publisher={IEEE}
130+
}
131+
132+
@incollection{zhou2014semi,
133+
title={Semi-supervised learning},
134+
author={Zhou, Xueyuan and Belkin, Mikhail},
135+
booktitle={Academic Press Library in Signal Processing},
136+
volume={1},
137+
pages={1239--1269},
138+
year={2014},
139+
publisher={Elsevier}
140+
}
141+
142+
@misc{javatpoint_semisupervised, title={Introduction to Semi-Supervised Learning - Javatpoint}, url={https://www.javatpoint.com/semi-supervised-learning}, journal={www.javatpoint.com}, author={JavaTPoint}
143+
}
144+
145+
@article{thekumparampil2018attention,
146+
title={Attention-based graph neural network for semi-supervised learning},
147+
author={Thekumparampil, Kiran K and Wang, Chong and Oh, Sewoong and Li, Li-Jia},
148+
journal={arXiv preprint arXiv:1803.03735},
149+
year={2018}
130150
}

Report/memoria.aux

Lines changed: 10 additions & 7 deletions
Original file line numberDiff line numberDiff line change
@@ -44,13 +44,16 @@
4444
\bibcite{guo2003knn}{4}
4545
\bibcite{hand2007principles}{5}
4646
\bibcite{supervised_learning_mathworks_inc}{6}
47-
\bibcite{KOTU201517}{7}
48-
\bibcite{learned2014introduction}{8}
49-
\bibcite{li2002unsupervised}{9}
50-
\bibcite{unsupervised_learning_clustering}{10}
51-
\@writefile{toc}{\contentsline {chapter}{Bibliograf\'{\i }a}{23}{chapter*.15}\protected@file@percent }
52-
\bibcite{sanchez_2020}{11}
53-
\bibcite{technovert_2020}{12}
47+
\bibcite{javatpoint_semisupervised}{7}
48+
\bibcite{KOTU201517}{8}
49+
\bibcite{learned2014introduction}{9}
50+
\bibcite{li2002unsupervised}{10}
51+
\@writefile{toc}{\contentsline {chapter}{Bibliograf\'{\i }a}{23}{chapter*.16}\protected@file@percent }
52+
\bibcite{unsupervised_learning_clustering}{11}
53+
\bibcite{sanchez_2020}{12}
54+
\bibcite{technovert_2020}{13}
55+
\bibcite{thekumparampil2018attention}{14}
56+
\bibcite{zhou2014semi}{15}
5457
\memsetcounter{lastsheet}{36}
5558
\memsetcounter{lastpage}{24}
5659
\gdef \@abspage@last{36}

Report/memoria.bbl

Lines changed: 15 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -31,6 +31,10 @@ David~J Hand.
3131
Mathworks Inc.
3232
\newblock Supervised learning.
3333

34+
\bibitem{javatpoint_semisupervised}
35+
JavaTPoint.
36+
\newblock Introduction to semi-supervised learning - javatpoint.
37+
3438
\bibitem{KOTU201517}
3539
Vijay Kotu and Bala Deshpande.
3640
\newblock Chapter 2 - data mining process.
@@ -62,4 +66,15 @@ Jose~Antonio Sanchez.
6266
Technovert.
6367
\newblock Introduction to machine learning, 2020.
6468

69+
\bibitem{thekumparampil2018attention}
70+
Kiran~K Thekumparampil, Chong Wang, Sewoong Oh, and Li-Jia Li.
71+
\newblock Attention-based graph neural network for semi-supervised learning.
72+
\newblock {\em arXiv preprint arXiv:1803.03735}, 2018.
73+
74+
\bibitem{zhou2014semi}
75+
Xueyuan Zhou and Mikhail Belkin.
76+
\newblock Semi-supervised learning.
77+
\newblock In {\em Academic Press Library in Signal Processing}, volume~1, pages
78+
1239--1269. Elsevier, 2014.
79+
6580
\end{thebibliography}

Report/memoria.blg

Lines changed: 32 additions & 32 deletions
Original file line numberDiff line numberDiff line change
@@ -11,45 +11,45 @@ A level-1 auxiliary file: ./tex/7_Conclusiones_Lineas_de_trabajo_futuras.aux
1111
The style file: plain.bst
1212
Database file #1: bibliografia.bib
1313
Warning--empty booktitle in Chapman2000CRISPDM1S
14-
You've used 12 entries,
14+
You've used 15 entries,
1515
2118 wiz_defined-function locations,
16-
575 strings with 5953 characters,
17-
and the built_in function-call counts, 3595 in all, are:
18-
= -- 336
19-
> -- 167
20-
< -- 2
21-
+ -- 66
22-
- -- 54
23-
* -- 211
24-
:= -- 597
25-
add.period$ -- 33
26-
call.type$ -- 12
27-
change.case$ -- 62
16+
590 strings with 6386 characters,
17+
and the built_in function-call counts, 4605 in all, are:
18+
= -- 437
19+
> -- 210
20+
< -- 4
21+
+ -- 83
22+
- -- 68
23+
* -- 267
24+
:= -- 754
25+
add.period$ -- 42
26+
call.type$ -- 15
27+
change.case$ -- 78
2828
chr.to.int$ -- 0
29-
cite$ -- 13
30-
duplicate$ -- 136
31-
empty$ -- 311
32-
format.name$ -- 54
33-
if$ -- 764
29+
cite$ -- 16
30+
duplicate$ -- 179
31+
empty$ -- 394
32+
format.name$ -- 68
33+
if$ -- 987
3434
int.to.chr$ -- 0
35-
int.to.str$ -- 12
36-
missing$ -- 7
37-
newline$ -- 58
38-
num.names$ -- 26
39-
pop$ -- 89
35+
int.to.str$ -- 15
36+
missing$ -- 9
37+
newline$ -- 72
38+
num.names$ -- 32
39+
pop$ -- 111
4040
preamble$ -- 1
41-
purify$ -- 50
41+
purify$ -- 63
4242
quote$ -- 0
43-
skip$ -- 114
43+
skip$ -- 154
4444
stack$ -- 0
45-
substring$ -- 174
46-
swap$ -- 29
47-
text.length$ -- 2
45+
substring$ -- 229
46+
swap$ -- 44
47+
text.length$ -- 4
4848
text.prefix$ -- 0
4949
top$ -- 0
50-
type$ -- 48
50+
type$ -- 60
5151
warning$ -- 1
52-
while$ -- 35
53-
width$ -- 14
54-
write$ -- 117
52+
while$ -- 44
53+
width$ -- 17
54+
write$ -- 147
5555
(There was 1 warning)

Report/memoria.out

Lines changed: 5 additions & 5 deletions
Original file line numberDiff line numberDiff line change
@@ -7,8 +7,8 @@
77
\BOOKMARK [1][-]{section.3.1}{\376\377\000M\000i\000n\000e\000r\000\355\000a\000\040\000d\000e\000\040\000d\000a\000t\000o\000s}{chapter*.6}% 7
88
\BOOKMARK [1][-]{section.3.2}{\376\377\000F\000u\000n\000c\000i\000\363\000n\000\040\000d\000i\000s\000t\000a\000n\000c\000i\000a\000\040\000e\000n\000t\000r\000e\000\040\000i\000n\000s\000t\000a\000n\000c\000i\000a\000s}{chapter*.6}% 8
99
\BOOKMARK [1][-]{section.3.3}{\376\377\000A\000p\000r\000e\000n\000d\000i\000z\000a\000j\000e\000\040\000e\000n\000\040\000m\000a\000c\000h\000i\000n\000e\000\040\000l\000e\000a\000r\000n\000i\000n\000g}{chapter*.6}% 9
10-
\BOOKMARK [0][-]{chapter*.11}{\376\377\000T\000\351\000c\000n\000i\000c\000a\000s\000\040\000y\000\040\000h\000e\000r\000r\000a\000m\000i\000e\000n\000t\000a\000s}{}% 10
11-
\BOOKMARK [0][-]{chapter*.12}{\376\377\000A\000s\000p\000e\000c\000t\000o\000s\000\040\000r\000e\000l\000e\000v\000a\000n\000t\000e\000s\000\040\000d\000e\000l\000\040\000d\000e\000s\000a\000r\000r\000o\000l\000l\000o\000\040\000d\000e\000l\000\040\000p\000r\000o\000y\000e\000c\000t\000o}{}% 11
12-
\BOOKMARK [0][-]{chapter*.13}{\376\377\000T\000r\000a\000b\000a\000j\000o\000s\000\040\000r\000e\000l\000a\000c\000i\000o\000n\000a\000d\000o\000s}{}% 12
13-
\BOOKMARK [0][-]{chapter*.14}{\376\377\000C\000o\000n\000c\000l\000u\000s\000i\000o\000n\000e\000s\000\040\000y\000\040\000L\000\355\000n\000e\000a\000s\000\040\000d\000e\000\040\000t\000r\000a\000b\000a\000j\000o\000\040\000f\000u\000t\000u\000r\000a\000s}{}% 13
14-
\BOOKMARK [0][-]{chapter*.15}{\376\377\000B\000i\000b\000l\000i\000o\000g\000r\000a\000f\000\355\000a}{}% 14
10+
\BOOKMARK [0][-]{chapter*.12}{\376\377\000T\000\351\000c\000n\000i\000c\000a\000s\000\040\000y\000\040\000h\000e\000r\000r\000a\000m\000i\000e\000n\000t\000a\000s}{}% 10
11+
\BOOKMARK [0][-]{chapter*.13}{\376\377\000A\000s\000p\000e\000c\000t\000o\000s\000\040\000r\000e\000l\000e\000v\000a\000n\000t\000e\000s\000\040\000d\000e\000l\000\040\000d\000e\000s\000a\000r\000r\000o\000l\000l\000o\000\040\000d\000e\000l\000\040\000p\000r\000o\000y\000e\000c\000t\000o}{}% 11
12+
\BOOKMARK [0][-]{chapter*.14}{\376\377\000T\000r\000a\000b\000a\000j\000o\000s\000\040\000r\000e\000l\000a\000c\000i\000o\000n\000a\000d\000o\000s}{}% 12
13+
\BOOKMARK [0][-]{chapter*.15}{\376\377\000C\000o\000n\000c\000l\000u\000s\000i\000o\000n\000e\000s\000\040\000y\000\040\000L\000\355\000n\000e\000a\000s\000\040\000d\000e\000\040\000t\000r\000a\000b\000a\000j\000o\000\040\000f\000u\000t\000u\000r\000a\000s}{}% 13
14+
\BOOKMARK [0][-]{chapter*.16}{\376\377\000B\000i\000b\000l\000i\000o\000g\000r\000a\000f\000\355\000a}{}% 14

Report/memoria.pdf

4.55 KB
Binary file not shown.

Report/memoria.synctex.gz

5.99 KB
Binary file not shown.

Report/memoria.toc

Lines changed: 6 additions & 5 deletions
Original file line numberDiff line numberDiff line change
@@ -13,8 +13,9 @@
1313
\contentsline {section}{\numberline {3.3}Aprendizaje en \textit {machine learning}}{11}{section.3.3}%
1414
\contentsline {subsection}{Aprendizaje supervisado}{12}{section*.9}%
1515
\contentsline {subsection}{Aprendizaje no supervisado}{13}{section*.10}%
16-
\contentsline {chapter}{Técnicas y herramientas}{15}{chapter*.11}%
17-
\contentsline {chapter}{Aspectos relevantes del desarrollo del proyecto}{17}{chapter*.12}%
18-
\contentsline {chapter}{Trabajos relacionados}{19}{chapter*.13}%
19-
\contentsline {chapter}{Conclusiones y Líneas de trabajo futuras}{21}{chapter*.14}%
20-
\contentsline {chapter}{Bibliograf\'{\i }a}{23}{chapter*.15}%
16+
\contentsline {subsection}{Aprendizaje semi-supervisado}{14}{section*.11}%
17+
\contentsline {chapter}{Técnicas y herramientas}{15}{chapter*.12}%
18+
\contentsline {chapter}{Aspectos relevantes del desarrollo del proyecto}{17}{chapter*.13}%
19+
\contentsline {chapter}{Trabajos relacionados}{19}{chapter*.14}%
20+
\contentsline {chapter}{Conclusiones y Líneas de trabajo futuras}{21}{chapter*.15}%
21+
\contentsline {chapter}{Bibliograf\'{\i }a}{23}{chapter*.16}%

Report/tex/3_Conceptos_teoricos.aux

Lines changed: 7 additions & 2 deletions
Original file line numberDiff line numberDiff line change
@@ -29,10 +29,15 @@
2929
\citation{li2002unsupervised}
3030
\@writefile{toc}{\contentsline {subsection}{Aprendizaje no supervisado}{13}{section*.10}\protected@file@percent }
3131
\newlabel{subsec:Aprendizaje-No-Supervisado}{{\M@TitleReference {3.3}{Aprendizaje no supervisado}}{13}{Aprendizaje no supervisado}{section*.10}{}}
32+
\citation{zhou2014semi}
33+
\citation{javatpoint_semisupervised}
34+
\citation{thekumparampil2018attention}
35+
\@writefile{toc}{\contentsline {subsection}{Aprendizaje semi-supervisado}{14}{section*.11}\protected@file@percent }
36+
\newlabel{subsec:Aprendizaje-Semi-Supervisado}{{\M@TitleReference {3.3}{Aprendizaje semi-supervisado}}{14}{Aprendizaje semi-supervisado}{section*.11}{}}
3237
\@setckpt{./tex/3_Conceptos_teoricos}{
3338
\setcounter{page}{15}
3439
\setcounter{equation}{0}
35-
\setcounter{enumi}{2}
40+
\setcounter{enumi}{3}
3641
\setcounter{enumii}{4}
3742
\setcounter{enumiii}{0}
3843
\setcounter{enumiv}{0}
@@ -85,7 +90,7 @@
8590
\setcounter{table}{0}
8691
\setcounter{lotdepth}{1}
8792
\setcounter{PWSTtable}{0}
88-
\setcounter{Item}{22}
93+
\setcounter{Item}{25}
8994
\setcounter{Hfootnote}{0}
9095
\setcounter{memhycontfloat}{0}
9196
\setcounter{Hpagenote}{0}

Report/tex/3_Conceptos_teoricos.tex

Lines changed: 17 additions & 1 deletion
Original file line numberDiff line numberDiff line change
@@ -164,4 +164,20 @@ \subsection{Aprendizaje no supervisado}\label{subsec:Aprendizaje-No-Supervisado}
164164
Con los datos agrupados el proceso de análisis de éstos puede comenzar. En ocasiones si el número de grupos detectados es muy alto, se pueden encontrar grupos o \textit{clusters} irrelevantes, permitiendo a los científicos de datos eliminar esos datos que los forman, reduciendo la dimensionalidad.
165165

166166
\item \textbf{Reducción de la dimensionalidad.} La clasificación en el aprendizaje automático se basa en atributos o características que tienen los datos, permitiendo su clasificación, valga la redundancia. Cuando los conjuntos de datos poseen múltiples características, más difícil resulta su clasificación. Es por ello que resulta útil identificar aquellos atributos que están fuertemente interrelacinados entre sí para eliminar todos menos un atributo, reduciendo la dimensionalidad.\cite{li2002unsupervised}
167-
\end{enumerate}
167+
\end{enumerate}
168+
169+
\subsection{Aprendizaje semi-supervisado}\label{subsec:Aprendizaje-Semi-Supervisado}
170+
\textit{Semi-Supervised Learning} según \cite{zhou2014semi}, se define como una forma de entrenamiento de modelos el cual usa tanto datos etiquetados como no etiquetados, i.e. si no sería un aprendizaje supervisado, Sección \ref{subsec:Aprendizaje-Supervisado}, o no supervisado, Sección \ref{subsec:Aprendizaje-No-Supervisado}.
171+
172+
El uso de aprendizaje semi-supervisado se caracteriza por ser más barato que el supervisado, ya que este último necesita que todo el conjunto de datos que va a utilizar para aprender esté etiquetado, y ese proceso es largo y costoso.Además, obtiene mejores resultados en menor tiempo que el aprendizaje no supervisado.
173+
Conseguir datos sin etiquetar es una tarea muy sencilla, mientras que conseguir conjuntos de datos etiquetados es un proceso complejo y actualmente no hay ``de todo''.
174+
175+
Para que el aprendizaje sea fructuoso requiere que las instancias se encuentren inter-relacionadas entre sí por alguna de sus características. \cite{javatpoint_semisupervised} indica las siguientes suposiciones que se dan en el aprendizaje semi-supervisado.
176+
\begin{enumerate}
177+
\item \textbf{Continuidad.} Se asume que los objetos cercanos entre sí se encontrarán en el mismo \textit{cluster} o grupo --- de etiquetas.
178+
\item \textbf{\textit{Clustering.}} Las instancias son divididas en diferentes grupos discretos, compartiendo todos los elementos de un \textit{cluster} la misma etiqueta.
179+
\item \textbf{\textit{Manifold}} o colectores. Se emplea el uso de distancias y funciones de densidad de forma que las instancias se encuentran en colectores con menos dimensiones que el espacio de entrada.
180+
\end{enumerate}
181+
182+
Dentro de las \textit{best preactices} en \textit{semi-supervised learning} se encuentran el uso de diferentes modelos de redes neuronales para el entrenamiento. \cite{thekumparampil2018attention}
183+
\newpage

0 commit comments

Comments
 (0)