la herramienta es lo de menos

abril 14, 2012

Hasta hace poco, consideraba que jamás dejaría de usar Beamer para hacer presentaciones. Como si hacerla en otra cosa le fuera a restar valor al contenido o algo así. Fué un auténtico lapsus-obsesivo. Si, Beamer es excelente si tu fuente es LaTeX pero si lo que buscas es que te facilite la incorporación de imágenes y uso de colores con transparencias y demás definitivamente Beamer solamente hará que te tardes mil años más.

Un día, preparando una presentación que me urgía, me dí cuenta de que Beamer, para ciertas cosas, no ayuda mucho. La presentación tenía una fuerte carga de imágenes y uso de color. El posicionamiento de imágenes en Beamer no es de arrastre y coloque; los colores tampoco se seleccionan de forma visual. Y así, después de pensarlo un poco (todavía lo pensé, qué horror), decidí usar Impress. Todo fluyó rápido y con mejores resultados que los que habría obtenido con Beamer. No es que Beamer sea malo y que ya no me guste, no. Beamer me gusta mucho pero cada cosa tiene su función. Sé que lo volveré a usar pero cuando sea apoyo y no un obstáculo.

Si no tienes nada qué decir, la herramienta es lo de menos.


Beamer para presentaciones – Templates

septiembre 23, 2011

Beamer es una clase de LaTeX para hacer presentaciones. Es mi favorita. Lo malo de mí es que siempre termino partiendo de cero para generar presentaciones nuevas y eso consume mucho tiempo. Por esa razón, ahora estoy haciendo archivos fuente básicos para tenerlos listos para usar.

Los templates en pdf son: bluebasicbluegblueredclear. El código de cada uno se encuentra disponible en github.

blueg en imágenes:


Diferencias de género y formas de expresarse

septiembre 18, 2011

Mira Leo, creí que solamente nos pasaba a los felinos

Post publicado en el blog de Cuadrivio

La forma de expresarse y de describir situaciones suele ser distinta en hombres y mujeres. Para referirnos a un hecho, las mujeres tendemos a describir los detalles, el ambiente, el clima, y podemos  llevarnos mucho tiempo en desmenuzar el suceso. Por el contrario, los hombres tienden a ser más concretos, menos emotivos. Hace varios años, después de una clase de matemáticas, surgió una plática sobre estas diferencias, por lo que pedimos a varios estudiantes que describieran la clase. Las respuestas representativas fueron las siguientes:

Ella:

En general, la clase estuvo muy bien, el profesor estuvo inspirado y explicó muy claro; me gustó. El profesor resolvió diversos ejercicios sobre Transformada de Laplace y usó dos marcadores, uno verde y otro negro, este último despedía un aroma desagradable, pero era el que pintaba mejor. El profesor llevaba unos pantalones caqui, camisa de algodón a cuadros, llevaba su barba a la cintura e iba de buen humor. El clima estuvo agradable, por lo que las dos horas pasaron volando. Sin embargo, los últimos quince minutos no fueron tan buenos: el último ejercicio no se terminó de explicar; tal parece que el profesor tenía algún compromiso, pues miraba frecuentemente su reloj; y además dejó mucha tarea. El pizarrón lo dejó totalmente escrito, sin espacio para una variable más.

Él:

La clase fue clara, bien explicada. Vimos Transformada de Laplace y el profesor dejó de tarea todos los ejercicios del capítulo 5.

Las diferencias son evidentes. En el primer caso se describen aspectos tales como el aroma del marcador, el ánimo del profesor y de paso se da una opinión sobre el clima. Expresiones y palabras como me gustó, agradable, desagradable y buen humor se refieren a interpretaciones subjetivas de la persona que hace la descripción. Y aunque en ambas descripciones la esencia es la misma: la clase fue buena, el profesor explicó bien, la respuesta de ella nos da una idea del entorno y nos permite imaginarnos la clase, mientras que el chico nos da una respuesta concisa y útil, aunque un tanto escueta.

Ambas formas de expresión son complementarias y aportan información sobre distintos aspectos, pero en ocasiones, dependiendo del medio y la situación, una forma es más aceptada que otra. Al estar en un medio académico-científico donde predomina el género masculino, he tenido que adaptar mi forma de expresión. Con el tiempo, he aprendido a redactar correos usando el mínimo de palabras posible, directos y al punto, evitando con ello problemas potencialmente originados por malas interpretaciones. Sin embargo, cuando la comunicación no va dirigida a alguien de un grupo específico, entonces las características del texto cambian, se vuelven más detalladas.

Otro ejemplo lo vemos en la escritura de artículos científicos. En un artículo o reporte científico no es objetivo ni práctico expresar la emoción y tampoco cabe la ambigüedad. No imagino la cara de los evaluadores si leyeran lo siguiente: «Los autores saltamos de gusto y casi trepamos por las paredes cuando los resultados mostraron una precisión del 98%, más allá del 75% reportado en los trabajos revisados». Tales descripciones ocuparían mucho espacio y nos harían sobrepasar el límite de páginas permitidas, además de no aportar información útil. Sin embargo, este tipo de descripciones mostrarían el lado humano y la sensibilidad de un sector que frecuentemente es catalogado como frío y aislado.

El género también puede ponerse en evidencia en las evaluaciones de artículos. Hace unos días recibí unas evaluaciones de un texto que envié, y me parece que una de ellas fue realizada por una mujer. No lo puedo asegurar, pero las características del texto cumplen con el patrón: uso de palabras y expresiones como amo, me encantaría que; uso de más de un párrafo para comentar un punto; y algunos comentarios subjetivos. En una revisión de esta naturaleza me parece mejor utilizar una escritura objetiva y concisa, pues evita malos entendidos. Sin embargo, el hecho de que un texto no cumpla con estas preferencias no significa que sea incorrecto. Por el contrario, un caso en el cual el uso de una descripción detallada favorece los resultados es la descripción de experimentos, puesto que explicar cada detalle es importante para poder reproducirlos. Hay casos en los que hasta el color de las paredes es significativo, pues puede ser la causa del buen o mal funcionamiento de algún sensor.

Las diferencias de género en la expresión oral o escrita no han pasado desapercibidas por las técnicas automáticas de reconocimiento. Twitter, además de ser un medio de socialización, se ha convertido en una popular fuente de datos para análisis. Esta plataforma se utilizó para identificar el género de una muestra de usuarios que incluyó 100,000 mujeres, 83,000 hombres y 53 usuarios con género no especificado; además de los tweets, se usaron los datos del perfil, incluyendo las ligas a blogs. Como resultado se obtuvieron precisiones de aproximadamente 67%, 75% y 92%, dependiendo de si el conjunto de prueba era un tweet, todos los tweets o todos los campos utilizados respectivamente. De esta manera se pudo saber si el usuario mintió al registrar su género. Se encontró que las palabras más usadas por las mujeres son: amor y cabello, mientras que fragmentos de palabras como http y Googl son más usados por hombres. Se observó también que las mujeres tienden a usar más emoticones y signos de exclamación que los hombres.

Las diferencias aquí mostradas se han restringido a conversaciones cotidianas y a documentos del ámbito académico-científico; en diversas formas de expresión literaria existen autores del género masculino con brillantes habilidades descriptivas que están fuera del alcance de este tipo de clasificaciones automáticas. En cuanto a autores, el interés radica en desarrollar algoritmos para identificación de plagio y reconocimiento de estilo.

Imagen: A happy couple

Referencia

John D. Burger, John Henderson, Discriminating gender on twitter, The MITRE Corporation, mayo, 2011. URL: http://www.mitre.org/work/tech_papers/2011/11_0170/11_0170.pdf-gender.html. Consultado el 10 de agosto de 2011.


¿nos controla o la controlamos?

agosto 10, 2011

Es frecuente asociar la inteligencia con el uso de diversas tecnologías. Recuerdo a una señora que decía que su hijo de 8 años era muy inteligente porque se la pasaba en su habitación encerrado usando Internet. Tal vez sí era inteligente pero no precisamente por saber navegar en Internet.

El avance tecnológico debe ser un medio que ayude a las personas a mejorar, a simplificar su vida. En muchos casos así es pero en otros ocurre lo contrario. Por ejemplo, aunque la cantidad de servicios bancarios en línea han aumentado y es posible realizar diversas transacciones sin necesidad de ir al banco, la atención personal para la solución de problemas ha desmejorado mucho. Los empleados de atención al público se limitan a ser intermediarios entre  el sistema y el cliente. Antiguamente, los empleados tenían facultades para resolver problemas pero ahora la decisión la tiene la computadora.

Por otra parte, el uso de redes sociales ha tenido enorme aceptación y aunque son un medio divertido  que permite difundir información y estar en contacto con amigos y familiares, también proporcionan una falsa idea de socializar, de tener amigos, de relacionarse con los demás. Mientras más tiempo se le dedica a este tipo de medios, más nos alejamos de una comunicación real.

¿En qué momento los beneficios que proporciona la tecnología se convierten en algo nocivo? cuando la tecnología nos controla en vez de que nosotros decidamos, cruzamos el umbral. La responsabilidad no es de la tecnología, la responsabilidad es de quienes la usamos.


entre Cuadrivio y yo

mayo 15, 2011

La escritura de artículos científicos no es fácil. Más bien, ningún tipo de escritura es fácil. Podrás buscar libros, manuales, artículos y un sinfín de herramientas para tratar de encontrar alguna guía que te indique cómo hacerlo; sin embargo,  jamás encontrarás la lista de pasos que milagrosamente te hagan comunicar bien las ideas.

¿Qué es lo que motiva a escribir? en muchos casos se escribe por necesidad. Para obtener el grado es necesario publicar cierto número de artículos. Posteriormente, si se sigue el camino académico es necesario publicar  para sostenerse en el gremio. Así, el escribir se convierte más en un asunto de necesidad que de gusto. Pero si el gusto predomina, entonces será un deleite.

El riesgo de que no se encuentre el gusto en escribir  es que tus artículos carezcan de personalidad. Un texto escrito sin el gusto de hacerlo puede ser gramatical y científicamente apropiado, correcto, pero será un texto sin corazón, soso y sin vida.

Es necesario despojarse del deseo de escribir por puntos, de escribir buscando la aprobación de alguien. Solamente así se puede descubrir un estilo propio, desconocido para ti mismo.

Hace un año conocí a Cuadrivio. Justamente en un momento en el que sentía la necesidad de escribir por gusto, de escribir porque sí. No por ISBNs, no porque “cuente”, no porque sea una publicación indexada al catálogo X. Hace un año la conocí y nos hicimos amigas.

Cuando hago un texto para Cuadrivio pienso en qué y cómo me gustaría que me contaran sobre el tema. Y trato de contarlo así. El grupo de personas que conforman Cuadrivio son inspiradoras y sumamante profesionales y eso motiva a cuidar tanto la forma como el fondo.

Después de revisar cada texto que envío y estar conforme, confieso que evito volverlo a ver. Sé que encontraré miles de detalles por mejorar, párrafos que “hubiera” dicho mejor de otro modo. La perfección no existe .

Y he descubierto con emoción que este proceso de escribir  predominantemente por placer, tiene sus efectos. Ahora estoy en el proceso de escritura de artículos científicos, llenos de tecnicismos, experimentos y referencias. Me encuentro con que estoy trasladando la motivación Cuadrívica a mis textos científicos. Y eso es algo invaluable.

Me falta mucho por practicar, mucho por escribir, mucho por saber. Pero cuando cada mini-proyecto, que es en lo que se convierte un texto que estás escribiendo te sabe a un dulce, simplemente es inevitable sonreír.


datos bonitos, datos feos

noviembre 9, 2010

Cuando vas a analizar, explorar, conocer conjuntos de datos, lo primero con lo que te encuentras (entre otras cosas) es que los datos no son tan bonitos como los que R incluye para experimentar. La mayor parte de los datos que escogí tienen formato csv, que es un simple formato tabular. Los datos bonitos son, por ejemplo:

surgery,age,hnumber,rectal-temp
no,adult,530101,38.5
yes,adult,534817,39.2
no,adult,530334,38.3
yes,young,5290409,39.1

Pero, ¿qué tiene de bonito el atributo sobre temperatura rectal (rectal-temp)? ¿Cuál es el criterio para decir que el archivo es bonito? En el ejemplo, todas las columnas están correctamente separadas por comas, con el mismo número de columnas por renglón y no hay caracteres raros. Este archivo puede usarse inmediatamente para análisis sin ninguna inversión de tiempo. Pero los conjuntos de datos en la realidad no son así, la mayoría es imperfecto y feo en mayor o menor medida. Veamos el siguiente:

User-ID,Location,Age
5262,&#turkey,27
9311,Ł,ódź,, lodzkie, poland,17
9335,san diego california usa,54

9396,, ,,44
9387,southlake texas usa,38

Horror. El archivo está plagado de símbolos raros que en nada ayudan a su proceso. Además, hay algunos registros que tienen más de tres columnas. Si eso no basta para decir que es feo, tiene renglones vacíos, que aunque para el ojo humano es “nada” generalmente para un programa si significa “algo” y no precisamente bondadoso. Por ejemplo, algunos programas nos dirán que este archivo feo tiene seis registros cuando en realidad tiene cinco.

Este archivo necesita un preproceso urgente que le quite lo feo para que se puedan hacer análisis confiables. Y así, ya que aceptamos que los datos reales difícilmente son bonitos,  entonces hay que decidir cómo los haremos bonitos. Eso depende de nuestras necesidades y de lo que hayamos visto que ocurre con más frecuencia en los datos disponibles: 1) ¿todas las columnas requieren limpieza?, tengo un archivo en el que una columna contiene URLs por lo que limpiarlo deformaría el dato, 2) ¿me importa que el valor del atributo se entienda?, 3) ¿qué caracteres debo eliminar?, 4) ¿qué caracteres debo sustituir?, 5) si un renglón no tiene la misma cantidad de atributos, ¿lo quito?,¿lo corrijo?,¿es relevante? Al primer vistazo puede parecer muy simple, sin embargo, las decisiones que se tomen son relevantes para los resultados de todo análisis.

¿Ven por qué es feo? el primer archivo no genera tanta interrogante. El segundo archivo es todo lo contrario, decisiones y más decisiones. No cabe duda, en un simple conjunto de datos se resume la vida misma.

Pues bien, como el punto es que hay que decidir, mi decisión inicial consiste en: 1) elimino los renglones vacíos, 2) elijo qué columnas limpiaré y 3) la limpieza consiste en eliminar los caracteres no-alfanuméricos. ¿Cómo hacerlo? No, ni lo piensen, hoja de cálculo no. Si tienes solamente un archivo pequeño y ese es tu único interés tal vez. Pero si el número de conjunto de datos a usar es indeterminado y no son pequeños entonces pensar siquiera en usar una hoja de cálculo sería un suicidio. Hice un script inicial en Python que hace la limpieza básica descrita; está disponible en el repositorio. R no es bueno para preprocesamiento, supone que los archivos llegan ya listos.

Lo bueno de todo es que esa fase de preprocesamiento permite que conozcas mejor los datos, que les conozcas sus defectos, que los veas de cerca, que te metas en ellos. Cuando los datos son bonitos, ni los miras (pero salen más rápido los resultados).

A veces, lo que creemos que es basura, no lo es

Imagen


R: tutoriales básicos y ejemplos de scripts

octubre 19, 2010

Cuando estás aprendiendo algo nuevo, un tutorial es de gran ayuda. Sin embargo, encontrar documentos que te faciliten el proceso de aprendizaje no siempre es sencillo. Después de revisar varios tutoriales de R, encontré algunos que permiten hacer cosas rápidamente, sentir y experimentar el lenguaje de forma inmediata.

Mis tutoriales básicos de R favoritos son los siguientes: tutorial 1, tutorial 2

Ahora sigue la parte interesante. Una herramienta es solamente el medio; la representación de la información, su análisis e interpretación no es responsabilidad del software.

En el git están disponibles los scripts.


Seguir

Recibe cada nueva publicación en tu buzón de correo electrónico.

%d personas les gusta esto: