Cancelación de datos en buscadores (I)

"Si un condenado por robo puede cancelar sus antecedentes penales al cabo de los años, ¿por qué no puedo eliminar la referencia a una multa de tráfico en Google?".

Probablemente esta pregunta ha asaltado a todo usuario que ha introducido su nombre en un buscador y ha tenido la amarga sorpresa de ver que algunos actos del pasado que le perjudicaban ocupaban posiciones privilegiadas en los resultados de la búsqueda y que no había ninguna referencia a su brillante expediente académico, a su trabajo o a cualquier otro aspecto de su vida del que podía sentirse más orgulloso.

En ciertas condiciones los buscadores de Internet pueden tener efectos desfavorables para la reputación de una persona. Ello es debido a las características de los buscadores que más definen su utilidad para los usuarios y su capacidad para diferenciarse de los competidores. Entre ellas cabe destacar las siguientes:


1. Indexación de gran alcance

El rastreo de los robots de los buscadores llega hasta el último rincón de la red, incluyendo sitios a los que nadie accede por desconocer que existen o por que carecen de interés. Sólo se excluyen de este proceso las páginas web que dan instrucciones a los robots para que no indexen su contenido.


2. Neutralidad

El buscador indexa tanto lo bueno como lo malo del pasado de una persona. La credibilidad de un buscador reside justamente en tratar por igual la información positiva y la información negativa. El buscador defiende al máximo este principio de neutralidad por muchas razones: credibilidad, garantía de no manipulación del algoritmo, imposibilidad de control, alto coste de gestión de las cancelaciones y oposiciones, posible responsabilidad como proveedor de servicios de información si introduce controles en la indexación, en el suministro de los enlaces y en los resultados de las búsquedas, etc. Por ello, los buscadores recurren todas las resoluciones de la Agencia Española de Protección de Datos en las que se les obliga a no indexar los contenidos negativos de una determinada persona.


3. Prioridad basada en la popularidad

Los contenidos negativos acostumbran a estar en boletines oficiales, periódicos, revistas…, es decir, en medios de comunicación que pueden llegar a ser más populares que los sitios que albergan los contenidos positivos: blogs, páginas personales, etc. También puede ocurrir que los propios usuarios seleccionen, por curiosidad o por morbo, los resultados más negativos, contribuyendo así a incrementar su nivel de popularidad en el buscador. Por ejemplo, la detención de un famoso por conducir bajo los efectos del alcohol genera más interés en los usuarios que su candidatura a un premio.


4. Localización instantánea o "efecto chivato"

Difícilmente una persona dedica su tiempo libre a leer el Boletín Oficial de la Provincia ni a buscar lo que se dice en él de sus amigos o conocidos. Sin embargo, si alguien introduce el nombre de una persona con poca actividad en la red en un buscador, es probable que los anuncios de embargos, multas o edictos judiciales publicados en los boletines oficiales aparezcan instantáneamente entre los primeros resultados. Existe una especie de ley de Murphy en los buscadores que hace que el contenido venga a ti aunque no lo estés buscando. Aunque sea una impresión subjetiva del afectado, parece que la ley de la fatalidad convierte la información negativa en un contenido "push" y a la información positiva en un contenido "pull".


5. Efecto amplificador

En algunos casos, el buscador amplía el alcance de difusión de un contenido, ya que permite que muchas personas que ni siquiera lo buscaban, ni conocían su existencia o localización, puedan acceder a él. Es posible que alguien se haya mantenido al margen de la red y los únicos contenidos relacionados con él en Internet sean los que aparecen en boletines oficiales, registros públicos y otras fuentes ajenas a su control.

En esos casos es posible que se convierta en relevante, por único o escaso, un dato negativo que se diluiría en el conjunto de la información relativa a una persona si esos datos positivos estuviesen también en la red. Por eso la primera estrategia de una persona que desea mejorar su reputación en la red consiste en publicar contenidos positivos sobre su persona en la red, que desplacen a los contenidos negativos a posiciones menos privilegiadas en los resultados de las búsquedas.

También se amplifican notablemente los contenidos por aparecer en las primeras posiciones de los resultados, debido a la popularidad de la fuente, a los clics de los usuarios de los buscadores o, como he dicho, a la ausencia de otros contenidos sobre esa persona. En estos casos se genera un círculo vicioso, ya que los primeros resultados son los más seleccionados por los usuarios y ello hace que se perpetúen en las primeras posiciones.

El efecto más dramático se produce cuando el nombre de una persona es indexado de forma asociada a una patología, defecto, adicción o afición. El efecto amplificador puede llegar al extremo de mostrar dicha asociación al facilitar el autocompletado de la búsqueda de los usuarios. Por ejemplo, completando de forma automática el nombre de una persona con palabras como alcohol, drogas, suicidio, etc.


6. Persistencia en el tiempo

La red no olvida. Hace unos años, visitar la hemeroteca de un periódico era como hacer arqueología entre montañas de papel llenas de polvo o pilas de rollos de celuloide rancio. Ahora Internet alberga todas las hemerotecas de los periódicos y constituye en sí mismo el mayor archivo de información creado por el hombre. Pero mientras unos se afanan en conseguir la máxima popularidad y las primeras posiciones en los buscadores, otros harían lo que fuese por desaparecer. Se trata de un colectivo que reclama el derecho al olvido, como acaba de reseñar la AEPD en su Memoria de 2009.

La persistencia en el tiempo de los contenidos alcanza su máximo exponente en la caché de los buscadores y en los grandes repositorios históricos, como Archive.org, que con su WayBack Machine permite visitar todas las versiones de una página web desde 1996.

Evitar la persistencia en el tiempo de un dato personal negativo exige por lo tanto la cancelación del mismo en la caché del buscador y en los repositorios históricos, así como la oposición a futuros tratamientos de indexación por parte del buscador.


Confluencia de varios intereses

El tratamiento de los datos personales con impacto reputacional negativo en los buscadores puede ser visto desde diferentes ópticas y provoca la confluencia de intereses tan legítimos como contrapuestos:

  1. El interés del usuario del buscador en encontrar tanto la información positiva como negativa de una persona.
  2. El interés de la fuente de la información en que sus contenidos sean indexados por los buscadores y aparezcan en las primeras posiciones de los resultados de la búsqueda.
  3. El interés del afectado en poder cancelar las referencias a datos que le perjudican y a que la red se olvide de él o de ciertos aspectos de su pasado.
  4. El interés del buscador en ofrecer un servicio que garantice la neutralidad de las búsquedas, indexando y haciendo accesibles los contenidos que existen en la red, sin manipulaciones ni privilegios.

En las siguientes entregas de este artículo, analizaré:

  1. Los casos en los una persona puede tener interés en que sus datos dejen de ser indexados por los buscadores.
  2. Las resoluciones de la AEPD en las que se ha exigido a un buscador que dejase de indexar datos de una persona.
  3. Los requisitos necesarios para que una persona pueda gestionar su reputación online oponiéndose a la indexación de sus datos.

Agilidad, formación y competitividad en España

Ayer asistí a la reunión anual de antiguos alumnos de la escuela de negocios suiza IMD. Me gustó mucho la conferencia de José López, Vicepresidente Ejecutivo de Nestlé.

Comentó cómo habían superado la crisis reputacional en Internet que se generó tras el vídeo de Greenpeace. Al final, la solución a la crisis provino del área de Operaciones que él dirige, demostrando el origen del aceite de palma utilizado en la elaboración de sus productos y la efectividad de las medidas de trazabilidad, sostenibilidad y protección del medio ambiente adoptadas por Nestlé.

José López remarcó que una crisis de este tipo es una gran oportunidad para entablar una conversación con los clientes, acreditar la calidad del trabajo realizado por la empresa y alinear la reputación con los objetivos estratégicos y la realidad de las empresas. Para ello se necesita una agilidad en la respuesta que no todas las empresas tienen.

Aludió reiteradamente al World Competitiveness Yearbook elaborado por IMD, cuya edición para 2010 acaba de ser publicada. En el ranking de competitividad por países (PDF), España ocupa el puesto número 36. Sorprendía al ponente que, a pesar de ello, las restricciones presupuestarias se concentrasen en las partidas relacionadas con la formación.

Con referencia a las diferentes estrategias formativas de cada país, José López comentó el caso de una empresa china que enviaba cada año a 300 directivos al MIT. Cuando preguntaron a un alto cargo de esta compañía si no le daba miedo que después de dar tanta formación los directivos se fuesen de la empresa, él respondió que le daba mucho más miedo no darles esa formación y que se quedasen.

Hacia la reputación 3.0

Poco a poco las empresas se van dando cuenta de la necesidad de gestionar su reputación en la red. El nivel de madurez es todavía muy bajo si tenemos en cuenta el potencial que existe en las actividades de búsqueda, análisis, gestión, participación, defensa…

Existen numerosas herramientas online y offline para automatizar o facilitar estas actividades, pero siempre es necesario la supervisión manual del experto, especialmente en la valoración de los matices que pueden hacer que un comentario sea etiquetado como positivo o negativo.

Los algoritmos más sencillos utilizados en la búsqueda y discriminación de comentarios que pueden tener un impacto reputacional negativo se basan en listas de palabras que normalmente se asocian a clientes insatisfechos o a trabajadores descontentos (por ejemplo), y a frases que se utilizan habitualmente con ánimo de reproche. Pero sigue produciéndose un alto nivel de falsos positivos, debido a la dificultad para relacionar la frase con el contexto, confirmar la pertenencia del autor a un grupo de interés prioritario o interpretar correctamente el matiz.

Progresivamente estos algoritmos se van perfeccionando y parece que SASI podría llegar a ser un ejemplo de ello. Se trata de un algoritmo basado en un experimento realizado sobre 66.000 comentarios de libros y otros productos ofrecidos en Amazon, por lo que su ámbito de actuación de limita principalmente al sector editorial.

Las personas que participaron en el experimento etiquetaron las frases que contenían cierto nivel de ironía verbal, como: "ideal para personas con problemas de insomnio", refiriéndose a un libro. Este algoritmo sigue dependiendo de un trabajo previo de selección y etiquetado de frases, pero es un primer paso para aplicar inteligencia en las búsquedas automatizadas.

Otra tecnología que puede ayudar a las búsquedas es el controvertido reconocimiento facial en las imágenes, que podría integrarse en una aplicación con algoritmos de análisis contextual y llevar la gestión de la reputación a cotas tan insospechadas como peligrosas. El debate sobre el uso de esta tecnología sigue en el seno de Google debido a su evidente impacto en materia de intimidad.

Error humano, informática y bolsa

Versión online del artículo publicado en Expansión el día 12 de mayo de 2010

Errores, órdenes de venta automáticas y volatilidad, una mezcla explosiva que costó 700.000 millones de dólares en unas horas. El análisis del episodio que se vivió en Wall Street el pasado 6 de mayo hace que nos preguntemos hasta qué punto es actualmente predecible y evitable esta combinación de fatalidades o de maniobras especuladoras en un entorno tan sensible como la bolsa.

Si la brusca acumulación de órdenes de venta tuvo realmente su origen en el tecleo de una B en lugar de una de M, el fenómeno no es nuevo y justamente por ello se plantea si podía haberse evitado e incluso si hubo algún ingrediente intencional. En cualquier actividad humana concurren factores ambientales, personales y estadísticos que configuran el nivel de probabilidad de que se produzca un error. Y ese riesgo es calculable mediante una simple fórmula matemática.

El Ministerio de Trabajo ha analizado la fiabilidad humana en la prevención de errores que pueden ocasionar accidentes laborales e incluso desastres en ciertas industrias. En la Nota Técnica de Prevención 377 se analizan distintos métodos de cálculo y predicción del error humano. Uno de los métodos más utilizados es THERP (Technique for human error rate prediction). Esta técnica considera a la persona como una fuente de fallos, y a partir de ahí, identifica las funciones que pueden verse afectadas por ellos y estima las probabilidades de ocurrencia del error.

La probabilidad de un error elemental se obtiene a través de la siguiente fórmula: P(E) = P1 K P2, donde P1 es la probabilidad nominal de error, K es un coeficiente de corrección (Por ejemplo, el nivel de estrés de la persona) y P2 es la probabilidad de no recuperación del error.

Pero en el caso que nos ocupa, una fórmula predictiva sólo nos serviría para confirmar el enorme riesgo asociado al tratamiento de datos que son interpretados por sistemas automatizados que pueden tomar decisiones masivas sobre compra y venta de acciones sin el filtro racional previo que puede aportar el ser humano.

Además de la posible manipulación especuladora, esta serie de fatalidades consistente en un dato erróneo y la posterior avalancha de órdenes provocada por los mecanismos stop loss de los sistemas de trading automatizado ya se ha dado en anteriores ocasiones. Recordemos el caso de la compañía aérea norteamericana sobre la que un sistema automatizado de noticias recuperó por error una nota de prensa relativa a su suspensión de pagos que se había emitido muchos años antes. Los sistemas de trading reaccionaron inmediatamente con órdenes de venta que provocaron el desplome del valor bursátil de la compañía en más del 75% en pocas horas.

El error afecta a todas las actividades del ser humano y las nuevas tecnologías pueden contribuir tanto a evitarlo como a facilitarlo y a amplificar sus efectos. En el caso de la bolsa, la clave radica en el proceso de introducción de los datos y en el diseño de sistemas que incorporen mayores medidas de seguridad.


La SEC estudia qué medidas debe aplicar
para impedir o limitar los efectos del pánico informatizado derivado de este tipo de errores y de la automatización de las transacciones, pero estas medidas ya deberían existir en una plaza como Wall Street. Extraña que el número de acciones a vender o comprar y el precio de las mismas se introduzca con letras y no con números. Ello se deduce de la alegada confusión entre la B y la M. Lo normal sería introducir la cifra en números dos veces de manera que el sistema pudiese detectar eventuales discrepancias entre las dos entradas. También es habitual establecer rangos de seguridad en los formularios electrónicos, mediante un algoritmo que pida reconfirmación en las operaciones superiores o inferiores en un determinado porcentaje sobre el valor esperado en ese campo. Por ejemplo el 60%, que fue el rango que aplicó Wall Street para anular las órdenes contaminadas por el presunto error.

Otra cautela obvia que debería introducir la SEC es la necesidad de intervención humana reconfirmando las órdenes de venta cuando el sistema detecte la aplicación automática y masiva del mecanismo stop loss. El algoritmo tendría en cuenta en este caso el número de órdenes relativas a un determinado valor, sesión o franja horaria, así como el número de acciones implicadas en las transacciones y el precio de las mismas. Cuando se confirmasen las reglas previstas en el algoritmo, podría exigirse en la confirmación de la operación.

En resumen, se trataría de incluir en el proceso de contratación de valores una serie de garantías previas, coetáneas y posteriores a la transacción, que ya existen en plataformas de comercio electrónico mucho más modestas e inofensivas que el parquet electrónico de Wall Street.

Últimos datos sobre facturación electrónica

Computerworld resume en un artículo los últimos datos respecto a la factura electrónica en Europa, de los que cabe destacar los siguientes:

  1. Facturas en papel estimadas para 2010 en Europa: más de 30.000 millones.
  2. Facturas electrónicas estimadas para 2010 en Europa: 2.200 millones.
  3. Crecimiento respecto al año anterior: 37%.
  4. Ahorro previsto para las empresas por la aplicación de la Directiva: 18.000 millones de euros.
  5. Plazo para que las legislaciones estatales equiparen la factura electrónica a la de papel: 2013.
  6. Fecha prevista para disponer de un estándar común: verano de 2010.
  7. Estándar común previsto: UNCEFACT Cross-Industry Invoice (CII) v.2. 

Información adicional: http://www.facturae.es

La logística de Apple

Ante la incertidumbre de la fecha de lanzamiento del iPad en España, la semana pasada decidí realizar la compra a través de nuestra oficina en Nueva York. La AppleStore aceptó el pedido realizado desde España al ser el lugar de entrega en Estados Unidos y no puso ningún reparo al hecho de que la dirección IP y el medio de pago fuesen españoles, lo cual es de agradecer.

Lo que más me ha impresionado ha sido la logística. Acostumbrado a recibir los productos de Apple desde Estados Unidos, me ha sorprendido que el iPad se envíe directamente desde la fábrica. Como puede verse en la siguiente captura del tracking, el paquete es remitido directamente desde Shenzhen (China) al comprador.

No puedo evitar comparar los acuerdos logísticos actuales con los de hace simplemente 10 ó 15 años. Entonces era difícil imaginar una entrega directa desde China, en tres días, con coste cero para el comprador. En cualquier caso, es digno de mención que uno de los principales obstáculos para el comercio electrónico, como es el coste del transporte, se haya resuelto de forma tan favorable para el consumidor.

Comparativamente, duele pagar unos gastos de envío de 8 euros por recibir una caja de fresones desde Huelva que cuesta 6 euros, es decir, 14 euros en total, pero es evidente que no se pueden comparar fresas con manzanas.

Tracking

 

Sentencia Louis Vuitton – Google 23-03-2010

Ayer se publicó la sentencia relativa al caso Louis Vuitton – Google por el uso de las marcas del demandante en el servicio de publicidad contextual Ad Words, al que me referí en un artículo publicado en La Ley. La sentencia, cuyo texto íntegro en inglés ya está disponible, da la razón a Google y declara que no es responsable del uso de marcas registradas por parte de los anunciantes en los servicios de publicidad contextual.

¿Por qué podría querer un iPad un abogado?

En mi caso personal, el hecho de pasar tres días a la semana en el despacho de Madrid y dos en el de Barcelona, me ha obligado a trabajar sin papeles y a tener todos los documentos en formato electrónico. 

Por ello, siempre he considerado poco eficiente tomar notas en papel en las reuniones, pero he seguido haciéndolo porque no he encontrado un medio cómodo y no invasivo para capturar y almacenar mis notas de forma electrónica. 

En una reunión de dos personas, la pantalla del portátil se convierte en una barrera vertical entre el cliente y tú. En una reunión con varias personas, si miras mucho la pantalla, da la impresión de que estás ausente del debate, leyendo correo electrónico o realizando otras funciones ajenas al objeto de la reunión. Aunque ello puede ser cierto a veces, también hay un componente cultural detrás de esa sospecha. El mismo componente cultural que hace que cuando la familia te ve leyendo el periódico en papel lo encuentre normal y en cambio, si te ve leyendo el periódico a través del ordenador o de la BlackBerry piense que eres un adicto al trabajo o a Internet.

Llevar los autos en el portátil para consultarlos en una vista judicial es ideal, pero tienes los mismos inconvenientes que en una reunión. A algunos magistrados no les gusta y en algunas salas no hay enchufes cerca de la mesa. 

La idea de un tablet, sea un iPad o el modelo de Microsoft, brinda la posibilidad de mantener un comportamiento muy similar al que adoptas cuando tomas notas en papel. Mi experiencia de tres años con un tablet PC con Windows XP fue muy positiva, pero tenía tres inconvenientes: el grosor del equipo, la aberración cromática causada por la pantalla táctil y los tiempos de arranque y recuperación. 

La experiencia de escribir en una hoja cuadriculada de OneNote no era la misma que la de escribir en una Moleskine, pero el resultado final era el mismo, y mucho más eficiente que escanear tus notas o volverlas a escribir en el ordenador. También era más ecológico. Dejé el tablet PC hace dos años para perderme en la amplitud de una pantalla de 17 pulgadas, a pesar de su mayor peso.

Las características ideales de un tablet, para el uso que yo le daría, serían las siguientes:

  1. Ligero.
  2. Fino.
  3. Rapidísimo.
  4. Con buena resolución de pantalla.
  5. Sin aberraciones cromáticas ni efecto moiré.
  6. Con un teclado virtual español de tamaño adecuado y con multipulsación.
  7. Que admita aplicaciones de reconocimiento de escritura manuscrita.
  8. Con 3G y WIFI.

En cualquier caso, un tablet de las características del iPad no sería, en mi caso, un sustituto del portátil, sino del papel. Es decir, un complemento ideal para reuniones, juicios, viajes y para todas aquellas situaciones en las que ahora seguimos prefiriendo acudir al papel antes que al portátil.

La FTC investiga el cloud computing como potencial amenaza para la seguridad

El boletín diario de seguridad de Inteco – Cert se hace eco de una noticia publicada en CSO (IDG) referida al inicio de una investigación sobre las potenciales amenazas que los servicios de cloud computing pueden representar para la privacidad y la seguridad de los datos de los consumidores.

La investigación es una iniciativa de la Federal Trade Commission (FTC) norteamericana y se extenderá al modo en que las empresas realizan la gestión de identidades en sus sistemas y aplicaciones. En este aspecto, el análisis se centrará en los medios que permitan a las empresas reforzar sus prácticas en materia de gestión de identidades.

La seguridad de los datos y la gestión de identidades son puntos clave a tener en cuenta en el momento de externalizar funciones relacionadas con el tratamiento de datos personales y al redactar las cláusulas de un contrato de cloud computing.

Mantengo mi opinión sobre la necesidad de establecer ciertas cautelas en la externalización, aunque, al parecer, esta prudencia será propia de iletrados digitales en 2010.

Nueva regulación del spam telefónico

El BOE del día 31/12/09 publica una modificación del régimen legal de la competencia desleal y de la publicidad en la que se incluyen varias limitaciones al telemarketing agresivo:

  1. Deslealtad de las llamadas comerciales no deseadas y reiteradas.
  2. Derecho de oposición a futuras llamadas.
  3. Identificación del número desde el que se realiza la llamada.

En el artículo 29 de la nueva ley, dedicado a las prácticas agresivas por acoso, se reputa desleal realizar propuestas comerciales no deseadas y reiteradas por teléfono, fax, correo electrónico u otros medios de comunicación a distancia, salvo en las circunstancias y en la medida en que esté justificado legalmente para hacer cumplir una obligación contractual.

Las empresas o profesionales deberán utilizar en estas comunicaciones sistemas que permitan al consumidor dejar constancia de su oposición a seguir recibiendo propuestas comerciales de dicho empresario o profesional.

Para que el consumidor o usuario pueda ejercer su derecho a manifestar su oposición a recibir propuestas comerciales no deseadas, cuando éstas se realicen por vía telefónica, las llamadas deberán realizarse desde un número de teléfono identificable.

Este supuesto se entenderá sin perjuicio de lo establecido en la normativa vigente sobre protección de datos personales, servicios de la sociedad de la información, telecomunicaciones y contratación a distancia con los consumidores o usuarios, incluida la contratación a distancia de servicios financieros.