martes, 30 de septiembre de 2014

Bases de Datos y Administración de la Información



Un sistema de información efectivo provee a los usuarios información precisa, oportuna y relevante lo cual se refiere a que debe ser libre de errores, disponible para los encargados de tomar decisiones  y  útil y apropiado tanto para trabajos como para las decisiones que la requieren.

Un sistema computacional organiza los datos en una jerarquía que empieza con bits y bytes, y progresa hasta llegar a los campos, registros, archivos y bases de datos
Un grupo de bits, denominado byte, representa a un solo carácter, un agrupamiento de caracteres se denomina campo. Un grupo de campos relacionados representan un registro; un grupo de registros del mismo tipo se denomina archivo. Un grupo de archivos relacionados constituye una base de datos. Un registro describe a una entidad. Una entidad es una persona, lugar, cosa o evento sobre el cual almacenamos y mantenemos información. Cada característica o cualidad que describe a una entidad específica se denomina atributo.

En la mayoría de las organizaciones, los sistemas tendían a crecer de manera independiente, lo que condujo a varios archivos maestros creados, mantenidos y operados por divisiones o departamentos separados. Los problemas resultantes son la redundancia e inconsistencia de los datos, la dependencia programa-datos, la inflexibilidad, la seguridad defectuosa de los datos y la incapacidad de compartir datos entre aplicaciones. La redundancia de los datos es la presencia de datos duplicados en varios archivos, lo cual desperdicia recursos de almacenamiento y también conduce a la inconsistencia de los datos. La dependencia programa-datos se refiere al acoplamiento de los datos almacenados en archivos y los programas específicos requeridos para actualizar y dar mantenimiento a esos archivos, de tal forma que los cambios en los programas requieran cambios en los datos. La Falta de flexibilidad se deriva de que un sistema de archivos tradicional puede entregar informes programados de rutina después de cierto esfuerzo extenso de programación, pero no puede entregar informes ad hoc ni responder de manera oportuna a los requerimientos de información no anticipados y en cuanto a seguridad, hay poco control de los datos, el acceso a la información, así como su diseminación y pueden estar fuera de control.

Un Sistema de Administración de Bases de Datos (DBMS) es un software que permite a una organización centralizar los datos, administrarlos en forma eficiente y proveer acceso a los datos almacenados mediante programas de aplicación. Un DBMS reduce la redundancia e inconsistencia de los datos al minimizar los archivos aislados en los que se repiten los mismos datos. El acceso y la disponibilidad de la información serán mayores, a la vez que se reducirán los costos de desarrollo y mantenimiento de los programas. El DBMS permite a la organización administrar los datos, su uso y su seguridad en forma central.

Las bases de datos relacionales representan los datos como tablas bidimensionales (llamadas relaciones), a las cuales se puede hacer referencia como si fueran archivos. Cada tabla contiene datos sobre una entidad y sus atributos. Las tablas de bases de datos relacionales se pueden combinar con facilidad para ofrecer los datos requeridos por los usuarios, siempre y cuando dos tablas cualesquiera compartan un elemento de datos común. En una base de datos relacional se utilizan tres operaciones básicas: seleccionar, unir y proyectar. La operación seleccionar crea un subconjunto que consiste en todos los registros del archivo que cumplan con criterios establecidos La operación unir combina tablas relacionales para proveer al usuario más información de la que está disponible en las tablas individuales. La operación proyectar crea un subconjunto que consiste de columnas en una tabla, con lo cual el usuario puede crear nuevas tablas que contengan sólo la información requerida.

Un DBMS orientado a objetos almacena los datos y los procedimientos que actúan sobre esos datos como objetos que se pueden recuperar y compartir de manera automática, pero son lentos en comparación con los DBMS relacionales para procesar grandes números de transacciones. Ahora hay sistemas DBMS objeto-relacional híbridos, que ofrecen las capacidades de los sistemas DBMS tanto orientados a objetos como relacionales

Los DBMS tienen una capacidad de definición de datos para especificar la estructura del contenido de la base de datos. Esta información sobre la base de datos se puede documentar en un diccionario de datos, el cual es un archivo automatizado o manual que almacena las definiciones de los elementos de datos y sus características. La mayoría de los DBMS tienen un lenguaje especializado conocido como lenguaje de manipulación de datos el cual se utiliza para agregar, modificar, eliminar y recuperar los datos en la base; el lenguaje de manipulación de datos más prominente en la actualidad es el lenguaje de consulta estructurado, o SQL.

La base de datos requiere tanto un diseño conceptual como uno físico. El diseño conceptual o lógico de la base de datos es un modelo abstracto de ésta desde una perspectiva de negocios, mientras que el diseño físico muestra la verdadera disposición de la base de datos en los dispositivos de almacenamiento de acceso directo. El proceso de crear estructuras de datos pequeñas y estables pero a la vez flexibles y adaptivas a partir de grupos complejos de datos se denomina normalización. Los sistemas de bases de datos relacionales tratan de cumplir reglas de integridad referencial para asegurar que las relaciones entre las tablas acopladas permanezcan consistentes. Las empresas necesitan bases de datos para proveer información que ayude a la compañía a operar sus negocios con más eficiencia, y ayudar a los gerentes y empleados a tomar mejores decisiones.

Un almacén de datos es una base de datos que almacena la información actual e histórica de interés potencial para los encargados de tomar decisiones en la compañía. Las principales herramientas para la inteligencia de negocios incluyen el software para consultas e informes de bases de datos, herramientas para el análisis de datos multidimensional OLAP (procesamiento analítico en línea). La minería de datos está más orientada al descubrimiento, ya que provee perspectivas hacia los datos corporativos que no se pueden obtener mediante OLAP, al encontrar patrones y relaciones ocultas en las bases de datos grandes e inferir reglas a partir de estos patrones y relaciones, para predecir el comportamiento a futuro.

El descubrimiento y análisis de los patrones útiles y la información proveniente de World Wide Web se denominan minería Web el cual es el proceso de extraer conocimiento del contenido de páginas Web. Ahora muchas compañías utilizan Web para poner parte de la información en sus bases de datos internas a disposición de los clientes y los socios de negocios obteniendo ventajas en cuanto al uso de Web para acceder a las bases de datos internas de una organización, ya que  el software de navegador Web es mucho más fácil de usar que las herramientas de consulta propietarias. En segundo lugar, la interfaz Web requiere pocos o ningún cambio en la base de datos interna y es mucho menos costoso agregar una interfaz Web frente a un sistema heredado que rediseñar y reconstruir el sistema para mejorar el acceso de los usuarios.

El acceso a las bases de datos corporativas por medio de Web está creando nuevas eficiencias, oportunidades y modelos de negocios. Para poder asegurar que los datos para su empresa sigan siendo precisos, confiables y estén disponibles de inmediato para aquellos que los necesiten, necesitará políticas y procedimientos especiales para la administración de datos.

Una política de información es la que especifica las reglas de la organización para compartir, diseminar, adquirir, estandarizar, clasificar e inventariar la información. La política de información establece procedimientos y rendiciones de cuentas específicos, identifica qué usuarios y unidades organizacionales pueden compartir información, en dónde distribuirla y quién es responsable de actualizarla y mantenerla. La administración de datos es responsable de las políticas y procedimientos específicos a través de los cuales se pueden administrar los datos como un recurso organizacional. La gobernanza de datos se encarga de las políticas y procedimientos para administrar la disponibilidad, utilidad, integridad y seguridad de los datos empleados en una empresa, con un énfasis especial en promover la privacidad, seguridad, calidad de los datos y el cumplimiento con las regulaciones gubernamentales.

Una base de datos y una política de información bien diseñadas son un gran avance en cuanto a asegurar que la empresa tenga la información que necesita. Los datos imprecisos, inoportunos o inconsistentes con otras fuentes de información conducen a decisiones incorrectas, llamadas a revisión de los productos y pérdidas financieras. Si una base de datos está diseñada en forma apropiada y hay estándares de datos establecidos a nivel empresarial, los elementos de datos duplicados o inconsistentes deben reducirse al mínimo. La mayoría de los problemas de calidad de los datos se derivan de los errores durante la captura de los datos. Con frecuencia, el análisis de la calidad de los datos empieza con una auditoría de calidad de los datos, la cual es una encuesta estructurada de la precisión y el nivel de su integridad en un sistema de información.
La limpieza de datos consiste en actividades para detectar y corregir datos en una base que sean incorrectos, incompletos, que tengan un formato inapropiado o que sean redundantes. La limpieza de datos no sólo corrige los errores, sino que también impone la consistencia entre los distintos conjuntos de datos que se originan en sistemas de información separados.

Los problemas de calidad de los datos no son sólo problemas de negocios, también representan serios problemas para los individuos, en cuanto a que afectan su condición financiera e incluso sus empleos.

Bibliografía
Laudon, Kenneth C. y Laudon, Jane P. (2012) Sistemas de información gerencial 



Decimosegunda edición PEARSON EDUCACIÓN, México, 2012.

No hay comentarios.:

Publicar un comentario