Added semi supervised learning #18

dpuenteramirez · dpuenteramirez · commit 401effcad900 · 2021-12-14T00:03:01.000+01:00
diff --git a/Report/bibliografia.bib b/Report/bibliografia.bib
@@ -127,4 +127,24 @@ @article{li2002unsupervised
   pages={673--690},
   year={2002},
   publisher={IEEE}
+}
+
+@incollection{zhou2014semi,
+  title={Semi-supervised learning},
+  author={Zhou, Xueyuan and Belkin, Mikhail},
+  booktitle={Academic Press Library in Signal Processing},
+  volume={1},
+  pages={1239--1269},
+  year={2014},
+  publisher={Elsevier}
+}
+
+@misc{javatpoint_semisupervised, title={Introduction to Semi-Supervised Learning - Javatpoint}, url={https://www.javatpoint.com/semi-supervised-learning}, journal={www.javatpoint.com}, author={JavaTPoint}
+} 
+
+@article{thekumparampil2018attention,
+  title={Attention-based graph neural network for semi-supervised learning},
+  author={Thekumparampil, Kiran K and Wang, Chong and Oh, Sewoong and Li, Li-Jia},
+  journal={arXiv preprint arXiv:1803.03735},
+  year={2018}
 }
diff --git a/Report/memoria.aux b/Report/memoria.aux
@@ -44,13 +44,16 @@
 \bibcite{guo2003knn}{4}
 \bibcite{hand2007principles}{5}
 \bibcite{supervised_learning_mathworks_inc}{6}
-\bibcite{KOTU201517}{7}
-\bibcite{learned2014introduction}{8}
-\bibcite{li2002unsupervised}{9}
-\bibcite{unsupervised_learning_clustering}{10}
-\@writefile{toc}{\contentsline {chapter}{Bibliograf\'{\i }a}{23}{chapter*.15}\protected@file@percent }
-\bibcite{sanchez_2020}{11}
-\bibcite{technovert_2020}{12}
+\bibcite{javatpoint_semisupervised}{7}
+\bibcite{KOTU201517}{8}
+\bibcite{learned2014introduction}{9}
+\bibcite{li2002unsupervised}{10}
+\@writefile{toc}{\contentsline {chapter}{Bibliograf\'{\i }a}{23}{chapter*.16}\protected@file@percent }
+\bibcite{unsupervised_learning_clustering}{11}
+\bibcite{sanchez_2020}{12}
+\bibcite{technovert_2020}{13}
+\bibcite{thekumparampil2018attention}{14}
+\bibcite{zhou2014semi}{15}
 \memsetcounter{lastsheet}{36}
 \memsetcounter{lastpage}{24}
 \gdef \@abspage@last{36}
diff --git a/Report/memoria.bbl b/Report/memoria.bbl
@@ -31,6 +31,10 @@ David~J Hand.
 Mathworks Inc.
 \newblock Supervised learning.
 
+\bibitem{javatpoint_semisupervised}
+JavaTPoint.
+\newblock Introduction to semi-supervised learning - javatpoint.
+
 \bibitem{KOTU201517}
 Vijay Kotu and Bala Deshpande.
 \newblock Chapter 2 - data mining process.
@@ -62,4 +66,15 @@ Jose~Antonio Sanchez.
 Technovert.
 \newblock Introduction to machine learning, 2020.
 
+\bibitem{thekumparampil2018attention}
+Kiran~K Thekumparampil, Chong Wang, Sewoong Oh, and Li-Jia Li.
+\newblock Attention-based graph neural network for semi-supervised learning.
+\newblock {\em arXiv preprint arXiv:1803.03735}, 2018.
+
+\bibitem{zhou2014semi}
+Xueyuan Zhou and Mikhail Belkin.
+\newblock Semi-supervised learning.
+\newblock In {\em Academic Press Library in Signal Processing}, volume~1, pages
+  1239--1269. Elsevier, 2014.
+
 \end{thebibliography}
diff --git a/Report/memoria.blg b/Report/memoria.blg
@@ -11,45 +11,45 @@ A level-1 auxiliary file: ./tex/7_Conclusiones_Lineas_de_trabajo_futuras.aux
 The style file: plain.bst
 Database file #1: bibliografia.bib
 Warning--empty booktitle in Chapman2000CRISPDM1S
-You've used 12 entries,
+You've used 15 entries,
             2118 wiz_defined-function locations,
-            575 strings with 5953 characters,
-and the built_in function-call counts, 3595 in all, are:
-= -- 336
-> -- 167
-< -- 2
-+ -- 66
-- -- 54
-* -- 211
-:= -- 597
-add.period$ -- 33
-call.type$ -- 12
-change.case$ -- 62
+            590 strings with 6386 characters,
+and the built_in function-call counts, 4605 in all, are:
+= -- 437
+> -- 210
+< -- 4
++ -- 83
+- -- 68
+* -- 267
+:= -- 754
+add.period$ -- 42
+call.type$ -- 15
+change.case$ -- 78
 chr.to.int$ -- 0
-cite$ -- 13
-duplicate$ -- 136
-empty$ -- 311
-format.name$ -- 54
-if$ -- 764
+cite$ -- 16
+duplicate$ -- 179
+empty$ -- 394
+format.name$ -- 68
+if$ -- 987
 int.to.chr$ -- 0
-int.to.str$ -- 12
-missing$ -- 7
-newline$ -- 58
-num.names$ -- 26
-pop$ -- 89
+int.to.str$ -- 15
+missing$ -- 9
+newline$ -- 72
+num.names$ -- 32
+pop$ -- 111
 preamble$ -- 1
-purify$ -- 50
+purify$ -- 63
 quote$ -- 0
-skip$ -- 114
+skip$ -- 154
 stack$ -- 0
-substring$ -- 174
-swap$ -- 29
-text.length$ -- 2
+substring$ -- 229
+swap$ -- 44
+text.length$ -- 4
 text.prefix$ -- 0
 top$ -- 0
-type$ -- 48
+type$ -- 60
 warning$ -- 1
-while$ -- 35
-width$ -- 14
-write$ -- 117
+while$ -- 44
+width$ -- 17
+write$ -- 147
 (There was 1 warning)
diff --git a/Report/memoria.out b/Report/memoria.out
@@ -7,8 +7,8 @@
 \BOOKMARK [1][-]{section.3.1}{\376\377\000M\000i\000n\000e\000r\000\355\000a\000\040\000d\000e\000\040\000d\000a\000t\000o\000s}{chapter*.6}% 7
 \BOOKMARK [1][-]{section.3.2}{\376\377\000F\000u\000n\000c\000i\000\363\000n\000\040\000d\000i\000s\000t\000a\000n\000c\000i\000a\000\040\000e\000n\000t\000r\000e\000\040\000i\000n\000s\000t\000a\000n\000c\000i\000a\000s}{chapter*.6}% 8
 \BOOKMARK [1][-]{section.3.3}{\376\377\000A\000p\000r\000e\000n\000d\000i\000z\000a\000j\000e\000\040\000e\000n\000\040\000m\000a\000c\000h\000i\000n\000e\000\040\000l\000e\000a\000r\000n\000i\000n\000g}{chapter*.6}% 9
-\BOOKMARK [0][-]{chapter*.11}{\376\377\000T\000\351\000c\000n\000i\000c\000a\000s\000\040\000y\000\040\000h\000e\000r\000r\000a\000m\000i\000e\000n\000t\000a\000s}{}% 10
-\BOOKMARK [0][-]{chapter*.12}{\376\377\000A\000s\000p\000e\000c\000t\000o\000s\000\040\000r\000e\000l\000e\000v\000a\000n\000t\000e\000s\000\040\000d\000e\000l\000\040\000d\000e\000s\000a\000r\000r\000o\000l\000l\000o\000\040\000d\000e\000l\000\040\000p\000r\000o\000y\000e\000c\000t\000o}{}% 11
-\BOOKMARK [0][-]{chapter*.13}{\376\377\000T\000r\000a\000b\000a\000j\000o\000s\000\040\000r\000e\000l\000a\000c\000i\000o\000n\000a\000d\000o\000s}{}% 12
-\BOOKMARK [0][-]{chapter*.14}{\376\377\000C\000o\000n\000c\000l\000u\000s\000i\000o\000n\000e\000s\000\040\000y\000\040\000L\000\355\000n\000e\000a\000s\000\040\000d\000e\000\040\000t\000r\000a\000b\000a\000j\000o\000\040\000f\000u\000t\000u\000r\000a\000s}{}% 13
-\BOOKMARK [0][-]{chapter*.15}{\376\377\000B\000i\000b\000l\000i\000o\000g\000r\000a\000f\000\355\000a}{}% 14
+\BOOKMARK [0][-]{chapter*.12}{\376\377\000T\000\351\000c\000n\000i\000c\000a\000s\000\040\000y\000\040\000h\000e\000r\000r\000a\000m\000i\000e\000n\000t\000a\000s}{}% 10
+\BOOKMARK [0][-]{chapter*.13}{\376\377\000A\000s\000p\000e\000c\000t\000o\000s\000\040\000r\000e\000l\000e\000v\000a\000n\000t\000e\000s\000\040\000d\000e\000l\000\040\000d\000e\000s\000a\000r\000r\000o\000l\000l\000o\000\040\000d\000e\000l\000\040\000p\000r\000o\000y\000e\000c\000t\000o}{}% 11
+\BOOKMARK [0][-]{chapter*.14}{\376\377\000T\000r\000a\000b\000a\000j\000o\000s\000\040\000r\000e\000l\000a\000c\000i\000o\000n\000a\000d\000o\000s}{}% 12
+\BOOKMARK [0][-]{chapter*.15}{\376\377\000C\000o\000n\000c\000l\000u\000s\000i\000o\000n\000e\000s\000\040\000y\000\040\000L\000\355\000n\000e\000a\000s\000\040\000d\000e\000\040\000t\000r\000a\000b\000a\000j\000o\000\040\000f\000u\000t\000u\000r\000a\000s}{}% 13
+\BOOKMARK [0][-]{chapter*.16}{\376\377\000B\000i\000b\000l\000i\000o\000g\000r\000a\000f\000\355\000a}{}% 14
diff --git a/Report/memoria.pdf b/Report/memoria.pdf
diff --git a/Report/memoria.synctex.gz b/Report/memoria.synctex.gz
diff --git a/Report/memoria.toc b/Report/memoria.toc
@@ -13,8 +13,9 @@
 \contentsline {section}{\numberline {3.3}Aprendizaje en \textit {machine learning}}{11}{section.3.3}%
 \contentsline {subsection}{Aprendizaje supervisado}{12}{section*.9}%
 \contentsline {subsection}{Aprendizaje no supervisado}{13}{section*.10}%
-\contentsline {chapter}{Técnicas y herramientas}{15}{chapter*.11}%
-\contentsline {chapter}{Aspectos relevantes del desarrollo del proyecto}{17}{chapter*.12}%
-\contentsline {chapter}{Trabajos relacionados}{19}{chapter*.13}%
-\contentsline {chapter}{Conclusiones y Líneas de trabajo futuras}{21}{chapter*.14}%
-\contentsline {chapter}{Bibliograf\'{\i }a}{23}{chapter*.15}%
+\contentsline {subsection}{Aprendizaje semi-supervisado}{14}{section*.11}%
+\contentsline {chapter}{Técnicas y herramientas}{15}{chapter*.12}%
+\contentsline {chapter}{Aspectos relevantes del desarrollo del proyecto}{17}{chapter*.13}%
+\contentsline {chapter}{Trabajos relacionados}{19}{chapter*.14}%
+\contentsline {chapter}{Conclusiones y Líneas de trabajo futuras}{21}{chapter*.15}%
+\contentsline {chapter}{Bibliograf\'{\i }a}{23}{chapter*.16}%
diff --git a/Report/tex/3_Conceptos_teoricos.aux b/Report/tex/3_Conceptos_teoricos.aux
@@ -29,10 +29,15 @@
 \citation{li2002unsupervised}
 \@writefile{toc}{\contentsline {subsection}{Aprendizaje no supervisado}{13}{section*.10}\protected@file@percent }
 \newlabel{subsec:Aprendizaje-No-Supervisado}{{\M@TitleReference {3.3}{Aprendizaje no supervisado}}{13}{Aprendizaje no supervisado}{section*.10}{}}
+\citation{zhou2014semi}
+\citation{javatpoint_semisupervised}
+\citation{thekumparampil2018attention}
+\@writefile{toc}{\contentsline {subsection}{Aprendizaje semi-supervisado}{14}{section*.11}\protected@file@percent }
+\newlabel{subsec:Aprendizaje-Semi-Supervisado}{{\M@TitleReference {3.3}{Aprendizaje semi-supervisado}}{14}{Aprendizaje semi-supervisado}{section*.11}{}}
 \@setckpt{./tex/3_Conceptos_teoricos}{
 \setcounter{page}{15}
 \setcounter{equation}{0}
-\setcounter{enumi}{2}
+\setcounter{enumi}{3}
 \setcounter{enumii}{4}
 \setcounter{enumiii}{0}
 \setcounter{enumiv}{0}
@@ -85,7 +90,7 @@
 \setcounter{table}{0}
 \setcounter{lotdepth}{1}
 \setcounter{PWSTtable}{0}
-\setcounter{Item}{22}
+\setcounter{Item}{25}
 \setcounter{Hfootnote}{0}
 \setcounter{memhycontfloat}{0}
 \setcounter{Hpagenote}{0}
diff --git a/Report/tex/3_Conceptos_teoricos.tex b/Report/tex/3_Conceptos_teoricos.tex
@@ -164,4 +164,20 @@ \subsection{Aprendizaje no supervisado}\label{subsec:Aprendizaje-No-Supervisado}
 	Con los datos agrupados el proceso de análisis de éstos puede comenzar. En ocasiones si el número de grupos detectados es muy alto, se pueden encontrar grupos o \textit{clusters} irrelevantes, permitiendo a los científicos de datos eliminar esos datos que los forman, reduciendo la dimensionalidad. 
 	
 	\item \textbf{Reducción de la dimensionalidad.} La clasificación en el aprendizaje automático se basa en atributos o características que tienen los datos, permitiendo su clasificación, valga la redundancia. Cuando los conjuntos de datos poseen múltiples características, más difícil resulta su clasificación. Es por ello que resulta útil identificar aquellos atributos que están fuertemente interrelacinados entre sí para eliminar todos menos un atributo, reduciendo la dimensionalidad.\cite{li2002unsupervised}
-\end{enumerate}
+\end{enumerate}
+
+\subsection{Aprendizaje semi-supervisado}\label{subsec:Aprendizaje-Semi-Supervisado}
+\textit{Semi-Supervised Learning} según \cite{zhou2014semi}, se define como una forma de entrenamiento de modelos el cual usa tanto datos etiquetados como no etiquetados, i.e. si no sería un aprendizaje supervisado, Sección \ref{subsec:Aprendizaje-Supervisado}, o no supervisado, Sección \ref{subsec:Aprendizaje-No-Supervisado}. 
+
+El uso de aprendizaje semi-supervisado se caracteriza por ser más barato que el supervisado, ya que este último necesita que todo el conjunto de datos que va a utilizar para aprender esté etiquetado, y ese proceso es largo y costoso.Además, obtiene mejores resultados en menor tiempo que el aprendizaje no supervisado. 
+Conseguir datos sin etiquetar es una tarea muy sencilla, mientras que conseguir conjuntos de datos etiquetados es un proceso complejo y actualmente no hay ``de todo''.
+
+Para que el aprendizaje sea fructuoso requiere que las instancias se encuentren inter-relacionadas entre sí por alguna de sus características. \cite{javatpoint_semisupervised} indica las siguientes suposiciones que se dan en el aprendizaje semi-supervisado.
+\begin{enumerate}
+	\item \textbf{Continuidad.} Se asume que los objetos cercanos entre sí se encontrarán en el mismo \textit{cluster} o grupo --- de etiquetas. 
+	\item \textbf{\textit{Clustering.}} Las instancias son divididas en diferentes grupos discretos, compartiendo todos los elementos de un \textit{cluster} la misma etiqueta.
+	\item \textbf{\textit{Manifold}} o colectores. Se emplea el uso de distancias y funciones de densidad de forma que las instancias se encuentran en colectores con menos dimensiones que el espacio de entrada.
+\end{enumerate}
+
+Dentro de las \textit{best preactices} en \textit{semi-supervised learning} se encuentran el uso de diferentes modelos de redes neuronales para el entrenamiento.  \cite{thekumparampil2018attention}
+\newpage
diff --git a/Report/tex/4_Tecnicas_y_herramientas.aux b/Report/tex/4_Tecnicas_y_herramientas.aux
@@ -1,10 +1,10 @@
 \relax 
 \providecommand\hyper@newdestlabel[2]{}
-\@writefile{toc}{\contentsline {chapter}{Técnicas y herramientas}{15}{chapter*.11}\protected@file@percent }
+\@writefile{toc}{\contentsline {chapter}{Técnicas y herramientas}{15}{chapter*.12}\protected@file@percent }
 \@setckpt{./tex/4_Tecnicas_y_herramientas}{
 \setcounter{page}{16}
 \setcounter{equation}{0}
-\setcounter{enumi}{2}
+\setcounter{enumi}{3}
 \setcounter{enumii}{4}
 \setcounter{enumiii}{0}
 \setcounter{enumiv}{0}
@@ -57,7 +57,7 @@
 \setcounter{table}{0}
 \setcounter{lotdepth}{1}
 \setcounter{PWSTtable}{0}
-\setcounter{Item}{22}
+\setcounter{Item}{25}
 \setcounter{Hfootnote}{0}
 \setcounter{memhycontfloat}{0}
 \setcounter{Hpagenote}{0}
diff --git a/Report/tex/5_Aspectos_relevantes_del_desarrollo_del_proyecto.aux b/Report/tex/5_Aspectos_relevantes_del_desarrollo_del_proyecto.aux
@@ -1,10 +1,10 @@
 \relax 
 \providecommand\hyper@newdestlabel[2]{}
-\@writefile{toc}{\contentsline {chapter}{Aspectos relevantes del desarrollo del proyecto}{17}{chapter*.12}\protected@file@percent }
+\@writefile{toc}{\contentsline {chapter}{Aspectos relevantes del desarrollo del proyecto}{17}{chapter*.13}\protected@file@percent }
 \@setckpt{./tex/5_Aspectos_relevantes_del_desarrollo_del_proyecto}{
 \setcounter{page}{18}
 \setcounter{equation}{0}
-\setcounter{enumi}{2}
+\setcounter{enumi}{3}
 \setcounter{enumii}{4}
 \setcounter{enumiii}{0}
 \setcounter{enumiv}{0}
@@ -57,7 +57,7 @@
 \setcounter{table}{0}
 \setcounter{lotdepth}{1}
 \setcounter{PWSTtable}{0}
-\setcounter{Item}{22}
+\setcounter{Item}{25}
 \setcounter{Hfootnote}{0}
 \setcounter{memhycontfloat}{0}
 \setcounter{Hpagenote}{0}
diff --git a/Report/tex/6_Trabajos_relacionados.aux b/Report/tex/6_Trabajos_relacionados.aux
@@ -1,10 +1,10 @@
 \relax 
 \providecommand\hyper@newdestlabel[2]{}
-\@writefile{toc}{\contentsline {chapter}{Trabajos relacionados}{19}{chapter*.13}\protected@file@percent }
+\@writefile{toc}{\contentsline {chapter}{Trabajos relacionados}{19}{chapter*.14}\protected@file@percent }
 \@setckpt{./tex/6_Trabajos_relacionados}{
 \setcounter{page}{20}
 \setcounter{equation}{0}
-\setcounter{enumi}{2}
+\setcounter{enumi}{3}
 \setcounter{enumii}{4}
 \setcounter{enumiii}{0}
 \setcounter{enumiv}{0}
@@ -57,7 +57,7 @@
 \setcounter{table}{0}
 \setcounter{lotdepth}{1}
 \setcounter{PWSTtable}{0}
-\setcounter{Item}{22}
+\setcounter{Item}{25}
 \setcounter{Hfootnote}{0}
 \setcounter{memhycontfloat}{0}
 \setcounter{Hpagenote}{0}
diff --git a/Report/tex/7_Conclusiones_Lineas_de_trabajo_futuras.aux b/Report/tex/7_Conclusiones_Lineas_de_trabajo_futuras.aux
@@ -1,10 +1,10 @@
 \relax 
 \providecommand\hyper@newdestlabel[2]{}
-\@writefile{toc}{\contentsline {chapter}{Conclusiones y Líneas de trabajo futuras}{21}{chapter*.14}\protected@file@percent }
+\@writefile{toc}{\contentsline {chapter}{Conclusiones y Líneas de trabajo futuras}{21}{chapter*.15}\protected@file@percent }
 \@setckpt{./tex/7_Conclusiones_Lineas_de_trabajo_futuras}{
 \setcounter{page}{22}
 \setcounter{equation}{0}
-\setcounter{enumi}{2}
+\setcounter{enumi}{3}
 \setcounter{enumii}{4}
 \setcounter{enumiii}{0}
 \setcounter{enumiv}{0}
@@ -57,7 +57,7 @@
 \setcounter{table}{0}
 \setcounter{lotdepth}{1}
 \setcounter{PWSTtable}{0}
-\setcounter{Item}{22}
+\setcounter{Item}{25}
 \setcounter{Hfootnote}{0}
 \setcounter{memhycontfloat}{0}
 \setcounter{Hpagenote}{0}