• ¿Quieres apoyar a nuestro foro haciendo una donación?, entra aquí.

Chile, el segundo país latinoamericano que más publica en ránking de Nature

Me parece que es un error establecer el numero de escritos por pais, como una medida fiable del quehacer cientifico. Por ahi, la relevancia cientifica se mide en muchos ambitos y quizas el numero de citas es importante como el "state of art" de las investigaciones en terminos de innovacion cientifica ... y ahi las cosas pueden variar, aunque no he visto estadisticas al respecto.
El número de publicaciones como tal no es malo. Considera que al realizar una investigación, por muy poco relevante que sea, ayuda a mejorar tus conocimientos y descubrir nuevas cosas junto a tu grupo de trabajo. Desde publicaciones muy rascas puedes llegar a un nivel de experiencia que te permita tener un impacto razonable en la comunidad científica. Por otro lado, el tema de las publicaciones y las citas sigue la misma ley que rige todo, la ley de pareto. Al final, sólo el 20% de las publicaciones (a lo mucho) llegarán a ser relevantes, por lo que si tu número de publicaciones es mayor, este 20% en términos absolutos también lo será.
 
Sinceramente soy un absoluto detractor de las revistas científicas de pago como la Nature, la ciencia debe ser absolutamente libre, lo mejor es que los "pre-print" de a poco se van a comer a los revistas cerradas.

Es realmente espectacular descargar un estudio con su material complementario, que incluyen datos, código del paquete estadístico y replicar sus hallazgos.
 
El número de publicaciones como tal no es malo. Considera que al realizar una investigación, por muy poco relevante que sea, ayuda a mejorar tus conocimientos y descubrir nuevas cosas junto a tu grupo de trabajo. Desde publicaciones muy rascas puedes llegar a un nivel de experiencia que te permita tener un impacto razonable en la comunidad científica. Por otro lado, el tema de las publicaciones y las citas sigue la misma ley que rige todo, la ley de pareto. Al final, sólo el 20% de las publicaciones (a lo mucho) llegarán a ser relevantes, por lo que si tu número de publicaciones es mayor, este 20% en términos absolutos también lo será.

Interesante, si hay un 20% relevantes, aunque me parece es mucho menos.

De cualquier manera siempre es bueno, como tu dices, que se logre publicar.
 
Interesante, si hay un 20% relevantes, aunque me parece es mucho menos.

De cualquier manera siempre es bueno, como tu dices, que se logre publicar.
Claro, el número puede variar, pero la tendencia es el 80/20. De hecho se puede probar muy fácil con los datos que compartí, si consideramos sólo las publicaciones con una cita de los datos de Chile entre el 2018 y 2019 (esto quiere decir que tuvo un impacto, pero habría que eliminar las autocitas, es decir, cuando un autor cita su mismo paper en otra publicación), la división da 2419/8899 = 0.27. Podemos ser mas finos y cambiar ese rango (pero considerando que son publicaciones nuevas, no tiene sentido), pero la relación será practicamente universal.
 
Claro, el número puede variar, pero la tendencia es el 80/20. De hecho se puede probar muy fácil con los datos que compartí, si consideramos sólo las publicaciones con una cita de los datos de Chile entre el 2018 y 2019 (esto quiere decir que tuvo un impacto, pero habría que eliminar las autocitas, es decir, cuando un autor cita su mismo paper en otra publicación), la división da 2419/8899 = 0.27. Podemos ser mas finos y cambiar ese rango (pero considerando que son publicaciones nuevas, no tiene sentido), pero la relación será practicamente universal.

Tendria que ver el origen de esas cifras en el grafico, pero me parece que para entablar alguna distribucion (como la de pareto) primero hay que dar vuelta el grafico del eje X, ya que el 0 esta a la derecha y notar el punto de corte entre un escrito citado y otro que no.


Luego, viendo la realidad individual de cada país, meto todo a una juguera (no entraré en detalles al método) y obtengo un índice que llamo índice de complejidad disciplinar para cada país, el que se mueve entre -1 y 1 y al correlacionarlo con el dinero efectivo que se otorga en relación al PIB per cápita obtengo esta hermosa correlación con un coeficiente de pearson de 0.84

Correlacion
KfskrJW.png


Que indica lo anterior (lo cual pienso validarlo con más países y publicarlo en una revista chora), que efectivametne las disciplinas que mencioné son las mas relevantes para investigar y convertir en país desarrollado. Por otro lado, si te fijas en el eje X, todos los países que están a la izquierda del 0 (sin contar el que está muy cerca del 0 que es portugal), son países en vías de desarrollo, mientras que los países que están entre el 0 y el 1 son países desarrollados, según la clasificación del Banco Mundial. El factor de número de publicaciones no afecta a estos resultados, ya que para cada país normalicé los valores para poder compararlo entre ellos.

Entonces, a lo que quiero llegar, es que podemos salir del bananismo si logramos aumentar el dinero invertido en I+D y potenciando las áreas que mencioné, pero como tenemos políticos ineptos y cortoplacistas, todo mi trabajo se va a la chucha :sm:


Ese indice de complejidad disciplinar, me gustaria verlo con un eje Z, señalando las clasificaciones de areas. El punto que seria bueno probar es que los paises desarrollados abordan todo un espectro mas homogeneo, y los paises en desarrollo no. Si animo de menospreciar las areas investigativas, meterle mucho en Chile a la astronomia, no tiene una relacion productiva tan directa que las investigciones respecto a los propias diferencias competitivos que plantean los paises desarrollados en el mundo.


Lo que quiero decir que esto del I+D, no solo es un asunto de plata, sino en donde esta el I+D ya que siempre se habla de ello, pero nadie dice que esto es un asunto de acoplamiento estructural dentro de un tejido productivo y no meter plata por meter plata, ademas que hay un indice mas importante que tambien se me viene a la cabeza, si tu dices que hay una distribucion de pareto, ... prueba que realmente existe en cada pais, por lo menos a mi no me consta. Ya haciendo la prueba de hipotesis, por la diferencia de la media, en una distribucion normal, deberiamos notar que los paises desarrollados son mas citados que los no desarrollados.

Eso tambien le daria mayor profundidad en el indice de complejidad disciplinar, ya que podrias poner ese enjuage en un modelo mas sofisticado como un ACP, si es que no hay correlacion, y si la hay presentar ese mismo grafico en 3D pero distinguiendo que los paises mas citados estan metidos en un grupo. Asi profundizarias en analisis desde un asunto de plata, a un asunto de innovacion el cual me parece mas solido el punto que quieres entablar.

De caulquer manera ese grafico es muy simplista y controversial acerca de la complejidad del I+D .. y lo otro es que solo tienes tres datos realmente que prueban el punto el cual puede que sean cuestionadas por ser outliers dentro de la hipotesis inicial y quizas algunos todavia pertenecen al grupo de los pencas. Lo otro es si estan normalizados para entablar la comparacion.

Pd. Estadisticamente si le meto k-means a esos datos .. ni cagando aparece la division inicial que planteas y puede que te aparezcan tres grupos y no dos: El monton de los pencas, los weones con plata pero igual son pencas, y los que realmente son buenos y compiten mediante el talento superlativo.
 
Última edición:
Tendria que ver el origen de esas cifras en el grafico, pero me parece que para entablar alguna distribucion (como la de pareto) primero hay que dar vuelta el grafico del eje X, ya que el 0 esta a la derecha y notar el punto de corte entre un escrito citado y otro que no.
La ley de pareto no es mas que una ley de potencia. Si cambias la escala a log log puedes ver que los datos parecieran que siguen la tendencia de una línea recta y se ajusta casi perfecto a una curva exponencial con un R2 = 0.869, por lo tanto se cumple
KjeJTGw.png
Ese indice de complejidad disciplinar, me gustaria verlo con un eje Z, señalando las clasificaciones de areas. El punto que seria bueno probar es que los paises desarrollados abordan todo un espectro mas homogeneo, y los paises en desarrollo no. Si animo de menospreciar las areas investigativas, meterle mucho en Chile a la astronomia, no tiene una relacion productiva tan directa que las investigciones respecto a los propias diferencias competitivos que plantean los paises desarrollados en el mundo.


Lo que quiero decir que esto del I+D, no solo es un asunto de plata, sino en donde esta el I+D ya que siempre se habla de ello, pero nadie dice que esto es un asunto de acoplamiento estructural dentro de un tejido productivo y no meter plata por meter plata, ademas que hay un indice mas importante que tambien se me viene a la cabeza, si tu dices que hay una distribucion de pareto, ... prueba que realmente existe en cada pais, por lo menos a mi no me consta. Ya haciendo la prueba de hipotesis, por la diferencia de la media, en una distribucion normal, deberiamos notar que los paises desarrollados son mas citados que los no desarrollados.

Eso tambien le daria mayor profundidad en el indice de complejidad disciplinar, ya que podrias poner ese enjuage en un modelo mas sofisticado como un ACP, si es que no hay correlacion, y si la hay presentar ese mismo grafico en 3D pero distinguiendo que los paises mas citados estan metidos en un grupo. Asi profundizarias en analisis desde un asunto de plata, a un asunto de innovacion el cual me parece mas solido el punto que quieres entablar.

De caulquer manera ese grafico es muy simplista y controversial acerca de la complejidad del I+D .. y lo otro es que solo tienes tres datos realmente que prueban el punto el cual puede que sean cuestionadas por ser outliers dentro de la hipotesis inicial y quizas algunos todavia pertenecen al grupo de los pencas. Lo otro es si estan normalizados para entablar la comparacion.

Pd. Estadisticamente si le meto k-means a esos datos .. ni cagando aparece la division inicial que planteas y puede que te aparezcan tres grupos y no dos: El monton de los pencas, los weones con plata pero igual son pencas, y los que realmente son buenos y compiten mediante el talento superlativo.
El punto de que Chile sea relevante en Astronomía poco le importa al índice, ya que astronomía, al ser muy específica, pondera muy poco puntaje.
Por otro lado, también comenté que los datos están normalizadoS para generar el índice, por lo tanto el asunto de que un país tenga mas citas o mas publicaciones no afecta, ya que se ve la materia de producción individual de cada país.

Lo otro, recuerda que los algoritmos de clustering no supervisados son técnicas que ayudan a tomar decisiones separando los datos en diversos grupos y ver cosas que generalmente no vemos, especialmente cuando tienes muchas variables. Para este caso es sólo mirar el indicador y ya se ve una diferencia entre un grupo y otro (-1 y 1), lo otro ya es meterle mas complejidad al modelo que de por si ya considero un monton de variables, entre ellas variables topológicas de red y topocráticas disciplinares.

A lo que quiero llegar es que el índice es construido con la red total de los 14 países y en base a eso se ha calculado su importancia y por eso la idea es poder validarlo con muchos países mas.

Por otro lado, las diferencias estructurales disciplinares de los países desarrollados y en vías de desarrollo se diferencia mas que nada en la fortaleza de vínculos que hay entre NATURAL SCIENCES y ENGINEERING AND TECHNOLOGY, es decir, mas que el número de citas, los países desarrollados trabajan en areas mucho mas multidisciplinares, en donde hay transferencia de conocimiento de un área a la otra.

Las cosas que propones se escapan de la idea del trabajo, recuerda además que esto no lo hago sólo y este trabajo ya ha sido revisado por otros pares en donde hemos verificado muchas cosas metodológicas.

En cualquier caso mientras no esté publicado de poco sirve esto, esperamos hacerlo en un par de meses.
 
La ley de pareto no es mas que una ley de potencia. Si cambias la escala a log log puedes ver que los datos parecieran que siguen la tendencia de una línea recta y se ajusta casi perfecto a una curva exponencial con un R2 = 0.869, por lo tanto se cumple
KjeJTGw.png

El punto de que Chile sea relevante en Astronomía poco le importa al índice, ya que astronomía, al ser muy específica, pondera muy poco puntaje.
Por otro lado, también comenté que los datos están normalizadoS para generar el índice, por lo tanto el asunto de que un país tenga mas citas o mas publicaciones no afecta, ya que se ve la materia de producción individual de cada país.

Lo otro, recuerda que los algoritmos de clustering no supervisados son técnicas que ayudan a tomar decisiones separando los datos en diversos grupos y ver cosas que generalmente no vemos, especialmente cuando tienes muchas variables. Para este caso es sólo mirar el indicador y ya se ve una diferencia entre un grupo y otro (-1 y 1), lo otro ya es meterle mas complejidad al modelo que de por si ya considero un monton de variables, entre ellas variables topológicas de red y topocráticas disciplinares.

A lo que quiero llegar es que el índice es construido con la red total de los 14 países y en base a eso se ha calculado su importancia y por eso la idea es poder validarlo con muchos países mas.

Por otro lado, las diferencias estructurales disciplinares de los países desarrollados y en vías de desarrollo se diferencia mas que nada en la fortaleza de vínculos que hay entre NATURAL SCIENCES y ENGINEERING AND TECHNOLOGY, es decir, mas que el número de citas, los países desarrollados trabajan en areas mucho mas multidisciplinares, en donde hay transferencia de conocimiento de un área a la otra.

Las cosas que propones se escapan de la idea del trabajo, recuerda además que esto no lo hago sólo y este trabajo ya ha sido revisado por otros pares en donde hemos verificado muchas cosas metodológicas.

En cualquier caso mientras no esté publicado de poco sirve esto, esperamos hacerlo en un par de meses.

Wena, muy interesante esa fortaleza de vinculos entre NATURAL SCIENCES y ENGINEERING AND TECHNOLOG, las dos por lo general ciencias aplicadas.

Quizas por ahi es interesante notar eso.

Pd. Log log realmente dejo la curva como planilandia.

Pd2. Sugiero metele powerBI a esos datos para mejor tratamiento ... Por ahi lo que haces es una inteligencia de negocios yese indice que aludes puedes definirlo como un KPI.

Saludos.
 
Última edición:
Pd2. Sugiero metele powerBI a esos datos para mejor tratamiento ... Por ahi lo que haces es una inteligencia de negocios yese indice que aludes puedes definirlo como un KPI.
De hecho utilizo machine learning para otras cosas, pero desde Python.
Considera además que estos resultados son la punta del iceberg no mas, posiblemente salgan mas cosas a futuro, por ahora prefiero fortalecer lo que tengo y despues explorar otras opciones.
 
De hecho utilizo machine learning para otras cosas, pero desde Python.
Considera además que estos resultados son la punta del iceberg no mas, posiblemente salgan mas cosas a futuro, por ahora prefiero fortalecer lo que tengo y despues explorar otras opciones.

Con esos graficos tan como las weas (esteticamente) ... pense que usabas R
 
Jajaj, son gráficos con spreadsheets de Google, me es útil para trabajar colaborativamente y hacer gráficos rápidos.
Para cosas serias uso matplotlib
 
No me habia fijado ... desde Python???? Python weon ... :nonono:, es como hacer prototipos con piezas de lego.
Que chucha :lol2:. Python tiene una de las comunidades mas grandes en lo que respecta machine learning y no hay que pagar ningún peso para eso. Lo mejor es que al ser un ambiente libre puedes saber exactamente lo que hace el algoritmo, a diferencia de herramientas cerradas como Azure o PowerBI, cuyos algoritmos suelen ser cajas negras.
Ahora que a la gente le guste tener todo facil y usar herramientas sencillas es otro punto, pero python es la raja para para todo.
 
Que chucha :lol2:. Python tiene una de las comunidades mas grandes en lo que respecta machine learning y no hay que pagar ningún peso para eso. Lo mejor es que al ser un ambiente libre puedes saber exactamente lo que hace el algoritmo, a diferencia de herramientas cerradas como Azure o PowerBI, cuyos algoritmos suelen ser cajas negras.
Ahora que a la gente le guste tener todo facil y usar herramientas sencillas es otro punto, pero python es la raja para para todo.

Puede ser que la mayoria haga la mas facil, pero eso no significa que sea correcto. Sin animo de hacer guerra santa, usar python en terminos tecnicos es como usar visual basic, quien no usaria algo facil a expensas de la escalabilidad, modularidad, uso de librerias de muy amplio espectro, uso de recursos, velocidad, aplicaciones criticas, aplicaciones de produccion, latenca, conectividad a bases de datos, etc.

Pero esta bien .. python da resultados en problemas pequeños.

Pero todas las librerias de computo high end y high computing, el cual casi todas son open source y estan en C++.

Mi conclusion es que Python es para millenial ... lo unico que hace es nivelar para abajo. Ese mismo problema tendra que escalar ... y ahi veremos si haber usado Python era baile.
 
Venezuela y Haití están en la lista??? Jajajaja se supone que ellos llegan porque son superiores al chileno gris e ignorante
 
Dejen de cobrar por publicaciones! De lo contrario seríamos mejor aún.
 
Puede ser que la mayoria haga la mas facil, pero eso no significa que sea correcto. Sin animo de hacer guerra santa, usar python en terminos tecnicos es como usar visual basic, quien no usaria algo facil a expensas de la escalabilidad, modularidad, uso de librerias de muy amplio espectro, uso de recursos, velocidad, aplicaciones criticas, aplicaciones de produccion, latenca, conectividad a bases de datos, etc.

Pero esta bien .. python da resultados en problemas pequeños.

Pero todas las librerias de computo high end y high computing, el cual casi todas son open source y estan en C++.

Mi conclusion es que Python es para millenial ... lo unico que hace es nivelar para abajo. Ese mismo problema tendra que escalar ... y ahi veremos si haber usado Python era baile.
Una de las gracias de python es que puede utilizar librerías de C o Fortran para cálculos complejos, lo que aumenta su rendimiento. Un ejemplo rápido de esto es esta libreria (https://graph-tool.skewed.de/) que sirve para generar grafos y calcular métricas como el Betweenness centrality (que es muy lento por ser un proceso iterativo) o el propio pagerank.
Al final Python es mas que nada un frontend de programación sencillo, por detrás puede estar corriendo C++ o cualquier otra cosa por detrás y ahorras tiempo en programar. Y que conste que yo aprendí a programar con ANSI C.

Por otro lado, casi toda la comunidad científica (de ciencia de datos) utiliza Python para la investigación. Investigar utilizando programas tipo PowerBi le quita peso, ya que la gracia de tener librerías libres es que, al entregar los resultados, sabemos exactamente que estamos haciendo.
 
Una de las gracias de python es que puede utilizar librerías de C o Fortran para cálculos complejos, lo que aumenta su rendimiento. Un ejemplo rápido de esto es esta libreria (https://graph-tool.skewed.de/) que sirve para generar grafos y calcular métricas como el Betweenness centrality (que es muy lento por ser un proceso iterativo) o el propio pagerank.
Al final Python es mas que nada un frontend de programación sencillo, por detrás puede estar corriendo C++ o cualquier otra cosa por detrás y ahorras tiempo en programar. Y que conste que yo aprendí a programar con ANSI C.

Por otro lado, casi toda la comunidad científica (de ciencia de datos) utiliza Python para la investigación. Investigar utilizando programas tipo PowerBi le quita peso, ya que la gracia de tener librerías libres es que, al entregar los resultados, sabemos exactamente que estamos haciendo.

La comunidad de ciencias de datos (industria) usa mayormente Fortran/C/C++ contertulio, por ahi me parece confunde cierta comunidad nivel USUARIO que usa Python, con la industria que se mueve en otro lado.

R tambien tiene subrutinas hechas en Fortran/C/C++. En problemas chicos .. todo bien, puedes usar hasta una planilla excel, y hace el trabajo.

Lo otro, esa cuestion de usar open source con licencias libres, es bien relativo, en los 90 hasta ahora todavia veo escritos con MATLAB, y eso nunca fue open source. Tambien la gente desestima usar R, por que los rutinas no estan consensuadas en la comunidad cientifica, pero python tambien tiene el mismo problema.
 
Volver
Arriba