Uno de los desafíos relacionados con llegar a una audiencia más amplia es que los lectores potenciales podrían usar una variedad de palabras para buscar las mismas. Las técnicas de procesamiento semántico que capitalizan las taxonomías y ontologías ayudan a crear metadatos ricos que pueden ayudar a mejorar el número de lectores o facilitar la información relevante en un blog. La plataforma de WordPress tiene complementos utilizados para funciones de taxonomía personalizadas, lo que facilita la creación de etiquetas y etiquetas de contenido. Pero el uso mucho más rico de las técnicas de procesamiento semántico está disponible en varias herramientas que se pueden usar en la casa o la nube de compañías como Wand Inc., Alchemy API y SAS Institute.
Elliot Turner, CEO y fundador de Alchemyapi, señaló que las personas fuera de los círculos académicos tienden a no hacer distinciones importantes entre los términos “taxonomía” y “ontología” y a usarlos indistintamente. Pero aclaró: “La realidad es que son bastante diferentes. Las taxonomías dividen un área de tópica de manera cada vez más granular a través de una estructura jerárquica. Las ontologías pueden proporcionar una perspectiva mucho más amplia, incorporando axiomas, reglas y muchos otros tipos de información. Finalmente, los editores usan taxonomías y ontologías para organizar contenido en jerarquías de actualidad que permiten a las personas encontrar la información que les importa “.
Las taxonomías complementan Mark Leher Ontologies, COO en Wand, Inc., dijo: “Las taxonomías y las ontologías son similares en que hay conjuntos de conceptos en un área temática determinada, que se utilizan para organizar la información. Ambos pueden considerarse como modelos de datos para organizar información. La taxonomía es un modelo más simple. La ontología es un modelo más complejo “. Las taxonomías se estructuran como un árbol con conceptos vinculados como conceptos más amplios o más pequeños. Por ejemplo, una taxonomía de muebles, “muebles de dormitorio” tendría términos más estrechos (o términos de los niños) de “camas” y “mesas de noche”. Las “camas” tendrían otro término niño “camas de trineo”. Lehrer dijo que las ontologías permiten el modelado más complejo de las relaciones entre conceptos, mucho más allá de las relaciones más amplias y más estrechas. Si las taxonomías son árboles, las ontologías se pueden representar mejor como redes. Por ejemplo, las “mesas de noche” podrían tener una relación con “roble” en “está hecho de”, y los “cajones” podrían tener un “es parte de la” relación con “mesitas de noche”. En ambos casos, es común tener sinónimos para asegurarse de que diferentes formas de decir los mismos conceptos estén conectados. Por ejemplo, “computadoras portátiles” tiene el sinónimo “computadoras portátiles”. Las taxonomías son perfectas para necesidades más simples, como proporcionar una estructura de navegación para navegar por un sitio web. Por ejemplo, Amazon utiliza una taxonomía para organizar sus páginas de productos, dijo Lehrer. Las ontologías son más importantes cuando desea celebrar análisis o preguntas.

Una taxonomía de los muebles sería excelente si desea ayudar a un usuario a encontrar una mesa de noche para comprar en un sitio web, señaló Lehrer. Una ontología de muebles sería excelente si desea responder una pregunta “¿Qué es la hora de acostarse?” Mejorar la búsqueda en el blog de Lehrer cree que las taxonomías se usan principalmente de dos maneras para blogs: sitios web y portales. Las primeras taxonomías pueden mejorar la navegación en el menú del sitio web. La mayoría de la navegación de menú comenzará con conceptos amplios y luego permitirá al usuario detallar conceptos más específicos.
Las taxonomías también se pueden utilizar para respaldar las palabras clave del contenido no estructurado, agregó Lehrer. Un usuario puede hacer una búsqueda de palabras clave para lo que quiera y puede obtener un conjunto de resultados. Luego, en el lado izquierdo, se pueden presentar los términos de la taxonomía (con el cual se ha etiquetado el contenido) para permitir al usuario restringir/filtrar el conjunto de resultados basados en los conceptos en la taxonomía. “Esta es una excelente herramienta adicional para aumentar la relevancia de un motor de búsqueda”, dijo Lehrer.
En cambio, las ontologías se usan con mayor frecuencia para permitir consultas de búsqueda más sofisticadas. Por ejemplo, una búsqueda en Google sobre “¿Quién era el 16º presidente?” Muestra una imagen y una breve biografía de Abraham Lincoln. Este no es el resultado del sitio web y, en cambio, es una respuesta directa a la pregunta. “Este tipo de resultado de la búsqueda probablemente funcione con una ontología en el fondo”, explicó Lehrer.
Cuando se aplican las taxonomías y las ontologías, pasan por datos de texto no estructurados para identificar, extraer y clasificar el contenido del blog, el sitio web y el portal, explicó Fiona McNeill, directora de marketing global en el Instituto SAS. Las herramientas dicen en esencia si un concepto de taxonomía o si existe o no una relación ontológica. Esta declaración crea nuevos metadatos sobre el blog, el sitio web o cualquier otro tipo de texto, dándoles nuevas etiquetas, que pueden incluirse en las rutinas de búsqueda y búsqueda. McNeil dijo: “Tales metadatos son extremadamente útiles para la desambigüedad: converger rápidamente el contenido y delimitar la intención del escritor. Por ejemplo, la distinción del término “jaguar” como vehículo hacia el animal. Estos metadatos adicionales se pueden representar de manera similar a los cuadros de información de Wikipedia para el usuario final. Más sobre el contenido se entiende a partir de los nuevos metadatos derivados (basados en el contenido en sí) y los interrogatorios que se hacen contra este conjunto de etiquetas enriquecidas/indexadas conducen a resultados mejores y más relevantes “.

Ir más allá de las etiquetas, el uso de etiquetas puede simplificar en gran medida la capacidad de buscar en los blogs relevantes, pero son difíciles de mantener a medida que aumenta el número de etiquetas. Esto limita su precisión y alcanza la profundidad del contenido del blog. Turner de Alchemyapi explicó que las palabras clave ofrecen utilidad en la organización de la información, pero tienen algunas limitaciones clave.
A saber, hay muchas palabras clave diferentes que pueden referirse al mismo tema (por ejemplo, “perros”, “caninos”, “perro”, etc.). Un sistema de software que se basa solo en las palabras clave eventualmente analizará cada una de estas palabras como un tema diferente, mientras que un sistema que utiliza taxonomías o conocimiento ontológicos puede colapsar estas diferentes palabras en el mismo tema (“perros”). Las taxonomías y las ontologías también pueden ayudar a identificar similitudes entre temas que no son directamente sinónimos, como “baloncesto” y “fútbol”, agregó Turner. Si bien estas palabras se refieren a una actividad diferente (baloncesto y fútbol), ambas se refieren a un tipo de deporte, una relación que se sorprendería en la jerarquía del conocimiento proporcionado por una taxonomía o ontología. Esta idea es similar a un árbol. . Si regresamos lo suficiente, encontramos que todos estamos relacionados. La misma analogía se aplica a la forma en que se etiqueta el contenido. Si sube el árbol, descubrirá cómo están conectados los términos. Estos conceptos son particularmente importantes para mejorar los adhesivos y los blogs, dijo Turner. “Los objetivos de la publicación de sitios web son el tiempo en el sitio (Sticky) y la participación con contenido y anuncios. Un editor quiere profundizar sus relaciones con los lectores, recomendando contenido de contenido que los mantenga en el sitio y hace que vean varias páginas (y más anuncios).
Finalmente, a medida que los editores se hunden en palabras clave larga en la cola o expresiones más específicas que es probable que los compradores usen cuando estén más cerca de una compra, vemos taxonomías y ontologías que exceden lo que las etiquetas pueden hacer a nivel de superficie “. Uno de los principales desafíos que enfrentan los editores en gran medida es que cientos o miles de autores generan contenido, ¿cómo son las recomendaciones significativas y la navegación cruzada en todos esos artículos? Un enfoque es tratar de obligar a los autores a respetar ciertas políticas de etiquetado. Dichas políticas requieren mucha capacitación y el desarrollo de estándares estrictos, y dicho proceso simplemente no se extiende para las plataformas de publicación abierta, señaló Turner. Explicó: “Creemos que un mejor enfoque es el uso de una taxonomía para las categorías” automáticamente “para encontrar enlaces comunes a las ideas expresadas de manera ligeramente diferente por diferentes autores. Esto permite que un editor se hunda más profundamente en el inventario de su sitio y atraiga contenido muy bien dirigido, lo que interesará a un lector. A su vez, esto aumenta el valor del contenido que existe con el tiempo. En lugar de un pico inmediato de interés cuando el artículo se publica por primera vez, seguido de una fuerte disminución, vemos una vida más larga del contenido que aumenta los ingresos generados por cualquier artículo individual “.
El uso de herramientas de taxonomías era un momento en que las personas trabajaban manualmente para construir representaciones jerárquicas de las áreas actuales.En algunas áreas de nicho con temas que no cambian con frecuencia, este proceso puede funcionar.Sin embargo, en la mayoría de las industrias, los sujetos a menudo cambian y no pueden ser monitoreados constantemente por las personas.Turner señaló: “He visto un cambio importante en las empresas que se dirigen a instrumentos automáticos, como Alchemyapi o Synaptic, que puede crear taxonomía sin intervención humana”.Los estándares para muchas taxonomías a menudo se centran en la forma en que el contenido está representado en el espacio publicitario.Por ejemplo, la taxonomía de la Guía para la garantía de calidad de la Oficina de Publicidad de Internet es una estructura común que permite que diferentes partes normalicen sus datos de etiquetado e intercambio de manera efectiva.
Los métodos no carmados, como Google Advertising, son ampliamente aceptados por gerentes de contenido que se basan en la optimización de los motores de búsqueda y la búsqueda orgánica.Los proveedores de contenido de Internet también comienzan a usar los estándares web para datos web semánticos, como OWL, RDF y SKOS, dijo Lehrer de Wand.Ve blogs y sitios web que también utilizan una variedad de herramientas para administrar taxonomías y ontologías, incluidas Synaptic, Smartogic Semaphore, Expert System y PoolParty.Lehrer agregó: “Algunas herramientas de extracción de texto han incorporado una buena gestión de taxonomía, pero en muchos casos, una compañía sería bienvenida a tener una herramienta de gestión de ontología independiente que pueda publicar ontología en la herramienta de extracción o análisis”.
Desafíos taxonómicos Uno de los desafíos es que muchas herramientas de estas herramientas deben estar capacitadas en datos de texto antes de que puedan usarse de manera efectiva, dijo McNeill del Instituto SAS. Para resolver este problema, SAS ha desarrollado un método único para aplicar técnicas de aprendizaje automático para descubrir relaciones semánticas iniciales y luego las ha utilizado para ayudar a delimitar categorías y conceptos. McNeill explicó: “El objetivo histórico era la necesidad de entrenarlos en los datos o clasificar manualmente una muestra de documentos para crear un conjunto de capacitación en el que se construyen los modelos de texto. Sin embargo, el progreso que SAS ha hecho en esta área con análisis contextual SAS atenúa estos requisitos históricos. Esto permite utilizar la minería de texto para desarrollar una taxonomía inicial que esté directamente refinada con reglas lingüísticas, dentro de la misma interfaz de software. SAS Text Miner también ofrece métodos de aprendizaje activos mediante los cuales los analistas pueden comenzar con una capacitación reducida, pero pueden mejorar sus modelos a través de la retroalimentación de relevancia que aprende el modelo con cada refinación. Otro desafío es equilibrar la necesidad de crear la complejidad necesaria para lograr perspectivas interesantes durante la extracción de texto con la necesidad de una forma simple de presentar la información a los usuarios, dijo Lehrer.

Explicó que las ontologías complejas son mejores para extraer información, mientras que los árboles taxonómicos más simples son mejores para presentar información. Entonces, encontrar este equilibrio es un desafío “. Las taxonomías y las ontologías pueden reflejar el sesgo, la visión del mundo y la experiencia de las personas que los crean, dijo Turner de Alchemyapi. “Si el contenido o artículo analiza un pasatiempo o un deporte que sea relevante en una región, pero no en otra, probablemente no recibirá ningún resultado o resultado incorrecto”. Además, las taxonomías y las ontologías sufren desafíos en torno a recientes. Turner explicó: “Las nuevas ideas, memes, palabras y contenidos se crean diariamente y es posible que los viejos modos de etiquetado no entiendan nuevos términos o que los etiqueten correctamente. Finalmente, un sistema debe reconocer las relaciones y colocarlas en una categoría relacionada que tenga sentido para los lectores y crecer a tiempo para responder a esos cambios dinámicos “. La transición a soluciones automáticas facilita el peso de estos desafíos y permite a las personas proporcionar orientación mientras se basan en automóviles que están mejor equipados para clasificar el contenido a gran escala. Por ejemplo, un grupo de ingenieros que analizan las taxonomías creadas por el hombre ha descubierto que “Kings of Leon” ha sido clasificado como “dignatarios y líderes mundiales en lugar de” música “o” banda “. Una taxonomía automatizada leería texto sobre “Kings of Leon” y comprendería con el tiempo que deben incluir esto en una categoría relacionada con la música, pero las personas que construyeron esta taxonomía en particular aún no habían oído hablar de la banda y, como resultado, por resultado fue clasificado incorrectamente. .
homefinance blog