El origen de los términos álgebra y algoritmo

http://www.thesmokesellers.com/wp-content/uploads/2007/05/abu_abdullah_muhammad_bin_musa_al-khwarizmiEn TSS nos encantan los algoritmos, tanto que tenemos un tag solo para ellos. Dado que empleamos el término tan a menudo, merece la pena saber cuales son sus origenes: Algoritmo proviene de un nombre propio, concretamente محمد بن موسى الخوارزمي ejem… quiero decir Muḥammad ibn MÅ«sā Al-KhwārizmÄ« reputado matemático, astrologo y geógrafo nacido alrededor del 780 d.C en Uzbekistan. La latinización de Al-KhwārizmÄ«: algoritmi, es lo que da origen al español algoritmo. Además, su libro Compendio sobre cálculo, completación y recolocación (الكتاب المختصر في حساب الجبر والمقابلة) fue el primer tratado sobre resolución de ecuaciones lineales y cuadráticas que existe y por tanto se considera a Al-KhwārizmÄ« junto con Diophanto [Ing] como los padres del álgebra.
Sigue leyendo

SPAM III: Envenenamiento Bayesiano

Bayesian Poisoning

No, no se trata de la última pelí­cula de Steven Seagal. Por petición de una mayorí­a de nuestros lectores, concretamente dos, vamos a cerrar la trilogí­a del SPAM (I, II) viendo porqué los spammers solo han perdido una batalla y no la guerra. Repasaremos las mejoras que han hecho los malos a sus tácticas y algoritmos de penetración (Envenenamiento Bayesiano, Whitelisting Troyano) y como los buenos no se ha quedado dormidos en su defensa de nuestra bandeja de entrada y han desarroyado algoritmos capaces de analizar el contexto del email (filtros Bayesianos-Markovianos). Hay que ver como le da al coco esta gente.

Sigue leyendo

Algoritmos de Yahoo: Flickr Interestingnessâ„¢

Interestingness Formula

Hace tiempo, A propuso en los comentarios de Algoritmos de Google: El Page Rankâ„¢ la posibilidad de que explicásemos como funciona el algoritmo que evalua la Interestingnessâ„¢ (o “interesancia” para los hispano hablantes) de las fotos de flickr*. Para los que no lo conozcan, flickr es un servicio online que te permite, tras hacerte una cuenta, subir una cantidad de fotos determinada al més a sus servidores y compartirlas con tus amigos o con todo el mundo.

Flickr Interestingness

La Interestingnessâ„¢ de una foto, mide simplemente lo interesante que es esa foto. Y funciona tan bien que la gente empieza a buscar algunas imagenes en flickr en vez de emplear la búsqueda de imágenes de google.

Hagamos una Comparación: Google images vs Yahoo Interestingnessâ„¢

En Yahoo! están tan contentos con el resultado, que han patentado la Interestingnessâ„¢, extendiendola no solo a fotos, si no a cualquier tipo de media-object (música, video…). Aplicando un poco de ingenierí­a inversa, vamos a ver que tan mágica es esa fórmula.

(*)No busques este pantallazo de flickr por ningún sitio. No existe como tal. No obstante todas las fotos son de flickr. Por si buscabas el enlace a la foto de la chica… está en el texto de post.

Sigue leyendo

Cómo funciona un filtro anti-spam

En los últimos 2 meses he recibido en mi cuenta de gmail 2053 correos basura, de los cuales aproximadamente un 98.5% se han ido directamente a la papelera. Se calcula que entre el 70% y el 80% del mail circulando es SPAM. En un post anterior explicamos el origen de este fenómeno y qué podí­amos hacer para reducirlo. Ahora veremos como se las arreglan Google, Yahoo & Cia para mantener nuestra bandeja de entrada los más limpia posible mediante algoritmos inteligentes (y algunos no tan inteligentes). Como siempre con la mí­nima cantidad de matemáticas posibles.

Sigue leyendo

Algoritmos de Google: El Page Rank

Method for node ranking in a linked database

absmiddle

(Método para la jerarquización de nodos en una base de datos enlazada)

La patente más famosa de Google es una de las principales ventajas competitivas que permitió a esta compañia aplastar a sus competidores en el campo de las busquedas en internet y hacerse el gigante que son hoy*. El Page Rank, como todos la conocemos, es una idea genial para hallar el valor o "importancia" que tiene una página web determinada. Esta "importancia" se emplea después para mostrar los resultados de mayor calidad cuando realizamos una búsqueda en Google. La calidad de los resultados de Google empleando este método (combinado, por supuesto, con otros algoritmos) es lo que nos hizo a todos abandonar nuestros antiguos buscadores (Altavista, Metacrawler) y pasarnos al buscador de Larry y Sergei. Aquí en The Smoke Sellers estamos un poco quemados con el hecho haber bajado de Page Rank y hemos estado intentando hincarle el diente estos días. En este post vamos a explicar el algoritmo hasta el final intentando emplear la cantidad mínima de matemáticas posibles.

(*) goran opina que otra de las principales ventajas competitivas de Google fue llenar una piscina olimpica de sangre de niños no bautizados y ofrecer su buscador a Satan.

Sigue leyendo