En TSS nos encantan los algoritmos, tanto que tenemos un tag solo para ellos. Dado que empleamos el término tan a menudo, merece la pena saber cuales son sus origenes: Algoritmo proviene de un nombre propio, concretamente Ù…Øمد بن موسى الخوارزمي ejem… quiero decir Muḥammad ibn MÅ«sÄ Al-KhwÄrizmÄ« reputado matemático, astrologo y geógrafo nacido alrededor del 780 d.C en Uzbekistan. La latinización de Al-KhwÄrizmÄ«: algoritmi, es lo que da origen al español algoritmo. Además, su libro Compendio sobre cálculo, completación y recolocación (الكتاب المختصر ÙÙŠ Øساب الجبر والمقابلة) fue el primer tratado sobre resolución de ecuaciones lineales y cuadráticas que existe y por tanto se considera a Al-KhwÄrizmÄ« junto con Diophanto [Ing] como los padres del álgebra.
Sigue leyendo
algoritmos
Hay 5 puestos etiquetados algoritmos (esta es la página 1 de 1).
SPAM III: Envenenamiento Bayesiano
No, no se trata de la última película de Steven Seagal. Por petición de una mayoría de nuestros lectores, concretamente dos, vamos a cerrar la trilogía del SPAM (I, II) viendo porqué los spammers solo han perdido una batalla y no la guerra. Repasaremos las mejoras que han hecho los malos a sus tácticas y algoritmos de penetración (Envenenamiento Bayesiano, Whitelisting Troyano) y como los buenos no se ha quedado dormidos en su defensa de nuestra bandeja de entrada y han desarroyado algoritmos capaces de analizar el contexto del email (filtros Bayesianos-Markovianos). Hay que ver como le da al coco esta gente.
Algoritmos de Yahoo: Flickr Interestingnessâ„¢
Hace tiempo, A propuso en los comentarios de Algoritmos de Google: El Page Rankâ„¢ la posibilidad de que explicásemos como funciona el algoritmo que evalua la Interestingnessâ„¢ (o «interesancia» para los hispano hablantes) de las fotos de flickr*. Para los que no lo conozcan, flickr es un servicio online que te permite, tras hacerte una cuenta, subir una cantidad de fotos determinada al més a sus servidores y compartirlas con tus amigos o con todo el mundo.
La Interestingnessâ„¢ de una foto, mide simplemente lo interesante que es esa foto. Y funciona tan bien que la gente empieza a buscar algunas imagenes en flickr en vez de emplear la búsqueda de imágenes de google.
Hagamos una Comparación: Google images vs Yahoo Interestingnessâ„¢
En Yahoo! están tan contentos con el resultado, que han patentado la Interestingnessâ„¢, extendiendola no solo a fotos, si no a cualquier tipo de media-object (música, video…). Aplicando un poco de ingeniería inversa, vamos a ver que tan mágica es esa fórmula.
(*)No busques este pantallazo de flickr por ningún sitio. No existe como tal. No obstante todas las fotos son de flickr. Por si buscabas el enlace a la foto de la chica… está en el texto de post.
Cómo funciona un filtro anti-spam
En los últimos 2 meses he recibido en mi cuenta de gmail 2053 correos basura, de los cuales aproximadamente un 98.5% se han ido directamente a la papelera. Se calcula que entre el 70% y el 80% del mail circulando es SPAM. En un post anterior explicamos el origen de este fenómeno y qué podíamos hacer para reducirlo. Ahora veremos como se las arreglan Google, Yahoo & Cia para mantener nuestra bandeja de entrada los más limpia posible mediante algoritmos inteligentes (y algunos no tan inteligentes). Como siempre con la mínima cantidad de matemáticas posibles.
Algoritmos de Google: El Page Rank
Method for node ranking in a linked database
(Método para la jerarquización de nodos en una base de datos enlazada)
La patente más famosa de Google es una de las principales ventajas competitivas que permitió a esta compañia aplastar a sus competidores en el campo de las busquedas en internet y hacerse el gigante que son hoy*. El Page Rank, como todos la conocemos, es una idea genial para hallar el valor o "importancia" que tiene una página web determinada. Esta "importancia" se emplea después para mostrar los resultados de mayor calidad cuando realizamos una búsqueda en Google. La calidad de los resultados de Google empleando este método (combinado, por supuesto, con otros algoritmos) es lo que nos hizo a todos abandonar nuestros antiguos buscadores (Altavista, Metacrawler) y pasarnos al buscador de Larry y Sergei. Aquí en The Smoke Sellers estamos un poco quemados con el hecho haber bajado de Page Rank y hemos estado intentando hincarle el diente estos días. En este post vamos a explicar el algoritmo hasta el final intentando emplear la cantidad mínima de matemáticas posibles.
(*) goran opina que otra de las principales ventajas competitivas de Google fue llenar una piscina olimpica de sangre de niños no bautizados y ofrecer su buscador a Satan.