Un sistema de información efectivo
provee a los usuarios información precisa, oportuna y relevante lo cual se
refiere a que debe ser libre de errores, disponible para los encargados de
tomar decisiones y útil y apropiado tanto para trabajos como para
las decisiones que la requieren.
Un sistema computacional organiza
los datos en una jerarquía que empieza con bits y bytes, y progresa hasta
llegar a los campos, registros, archivos y bases de datos
Un grupo de bits, denominado byte,
representa a un solo carácter, un agrupamiento de caracteres se denomina campo. Un grupo de campos relacionados
representan un registro; un grupo de registros del mismo
tipo se denomina archivo. Un grupo de archivos relacionados
constituye una base
de datos. Un
registro describe a una entidad. Una entidad es
una persona, lugar, cosa o evento sobre el cual almacenamos y mantenemos
información. Cada característica o cualidad que describe a una entidad
específica se denomina atributo.
En la mayoría de las organizaciones, los sistemas tendían a
crecer de manera independiente, lo que condujo a varios archivos maestros creados,
mantenidos y operados por divisiones o departamentos separados. Los problemas
resultantes son la redundancia e inconsistencia de los datos, la dependencia programa-datos,
la inflexibilidad, la seguridad defectuosa de los datos y la incapacidad de
compartir datos entre aplicaciones. La redundancia
de los datos es la
presencia de datos duplicados en varios archivos, lo cual desperdicia recursos
de almacenamiento y también conduce a la inconsistencia de los datos. La dependencia programa-datos se refiere al acoplamiento de los datos almacenados en archivos
y los programas específicos requeridos para actualizar y dar mantenimiento a
esos archivos, de tal forma que los cambios en los programas requieran cambios
en los datos. La Falta de flexibilidad se deriva de que un sistema de archivos tradicional
puede entregar informes programados de rutina después de cierto esfuerzo
extenso de programación, pero no puede entregar informes ad hoc ni responder de
manera oportuna a los requerimientos de información no anticipados y en cuanto a
seguridad, hay poco control de los
datos, el acceso a la información, así como su diseminación y pueden estar
fuera de control.
Un Sistema de Administración de Bases de Datos (DBMS) es un software que permite a una
organización centralizar los datos, administrarlos en forma eficiente y proveer
acceso a los datos almacenados mediante programas de aplicación. Un DBMS reduce
la redundancia e inconsistencia de los datos al minimizar los archivos aislados
en los que se repiten los mismos datos. El acceso y la disponibilidad de la
información serán mayores, a la vez que se reducirán los costos de desarrollo y
mantenimiento de los programas. El DBMS permite a la organización administrar
los datos, su uso y su seguridad en forma central.
Las bases de datos relacionales
representan los datos como tablas bidimensionales (llamadas relaciones), a las
cuales se puede hacer referencia como si fueran archivos. Cada tabla contiene
datos sobre una entidad y sus atributos. Las tablas de bases de datos
relacionales se pueden combinar con facilidad para ofrecer los datos requeridos
por los usuarios, siempre y cuando dos tablas cualesquiera compartan un
elemento de datos común. En una base de datos relacional se utilizan tres
operaciones básicas: seleccionar, unir y proyectar. La operación seleccionar crea un subconjunto que consiste en
todos los registros del archivo que cumplan con criterios establecidos La
operación unir
combina tablas
relacionales para proveer al usuario más información de la que está disponible
en las tablas individuales. La operación proyectar crea un subconjunto que consiste de columnas en una tabla, con
lo cual el usuario puede crear nuevas tablas que contengan sólo la información
requerida.
Un DBMS orientado a objetos almacena los datos y los procedimientos que actúan sobre esos
datos como objetos que se pueden recuperar y compartir de manera automática,
pero son lentos en comparación con los DBMS relacionales para procesar grandes
números de transacciones. Ahora hay sistemas DBMS objeto-relacional híbridos, que ofrecen las capacidades de los sistemas DBMS tanto
orientados a objetos como relacionales
Los DBMS tienen una capacidad de definición de datos para especificar la estructura del
contenido de la base de datos. Esta información sobre la base de datos se puede
documentar en un diccionario
de datos, el cual
es un archivo automatizado o manual que almacena las definiciones de los
elementos de datos y sus características. La
mayoría de los DBMS tienen un lenguaje especializado conocido como lenguaje de manipulación de datos el cual se utiliza para agregar,
modificar, eliminar y recuperar los datos en la base; el lenguaje de
manipulación de datos más prominente en la actualidad es el lenguaje de
consulta estructurado, o SQL.
La base de datos requiere tanto un
diseño conceptual como uno físico. El diseño conceptual o lógico de la base de
datos es un modelo abstracto de ésta desde una perspectiva de negocios,
mientras que el diseño físico muestra la verdadera disposición de la base de
datos en los dispositivos de almacenamiento de acceso directo. El proceso de
crear estructuras de datos pequeñas y estables pero a la vez flexibles y
adaptivas a partir de grupos complejos de datos se denomina normalización. Los
sistemas de bases de datos relacionales tratan de cumplir reglas de integridad
referencial para asegurar que las relaciones entre las tablas acopladas
permanezcan consistentes. Las empresas necesitan bases de datos para proveer
información que ayude a la compañía a operar sus negocios con más eficiencia, y
ayudar a los gerentes y empleados a tomar mejores decisiones.
Un almacén de datos es una base de
datos que almacena la información actual e histórica de interés potencial para
los encargados de tomar decisiones en la compañía. Las principales herramientas
para la inteligencia de negocios incluyen el software para consultas e informes
de bases de datos, herramientas para el análisis de datos multidimensional OLAP
(procesamiento analítico en línea). La minería de datos está más orientada al
descubrimiento, ya que provee perspectivas hacia los datos corporativos que no
se pueden obtener mediante OLAP, al encontrar patrones y relaciones ocultas en
las bases de datos grandes e inferir reglas a partir de estos patrones y
relaciones, para predecir el comportamiento a futuro.
El descubrimiento y análisis de los
patrones útiles y la información proveniente de World Wide Web se denominan minería Web el cual es el proceso de extraer
conocimiento del contenido de páginas Web. Ahora muchas compañías utilizan Web
para poner parte de la información en sus bases de datos internas a disposición
de los clientes y los socios de negocios obteniendo ventajas en cuanto al uso
de Web para acceder a las bases de datos internas de una organización, ya que el software de navegador Web es mucho más
fácil de usar que las herramientas de consulta propietarias. En segundo lugar,
la interfaz Web requiere pocos o ningún cambio en la base de datos interna y es
mucho menos costoso agregar una interfaz Web frente a un sistema heredado que
rediseñar y reconstruir el sistema para mejorar el acceso de los usuarios.
El acceso a las bases de datos
corporativas por medio de Web está creando nuevas eficiencias, oportunidades y
modelos de negocios. Para poder asegurar que los datos para su empresa sigan
siendo precisos, confiables y estén disponibles de inmediato para aquellos que
los necesiten, necesitará políticas y procedimientos especiales para la
administración de datos.
Una política de información es la que especifica las reglas de
la organización para compartir, diseminar, adquirir, estandarizar, clasificar e
inventariar la información. La política de información establece procedimientos
y rendiciones de cuentas específicos, identifica qué usuarios y unidades
organizacionales pueden compartir información, en dónde distribuirla y quién es
responsable de actualizarla y mantenerla. La administración de datos es responsable de las políticas y procedimientos específicos a
través de los cuales
se pueden
administrar los datos como un recurso organizacional. La gobernanza de datos se encarga de las políticas y procedimientos
para administrar la disponibilidad, utilidad, integridad y seguridad de los
datos empleados en una empresa, con un énfasis especial en promover la
privacidad, seguridad, calidad de los datos y el cumplimiento con las
regulaciones gubernamentales.
Una base de datos y una política de
información bien diseñadas son un gran avance en cuanto a asegurar que la
empresa tenga la información que necesita. Los datos imprecisos, inoportunos o
inconsistentes con otras fuentes de información conducen a decisiones incorrectas,
llamadas a revisión de los productos y pérdidas financieras. Si una base de
datos está diseñada en forma apropiada y hay estándares de datos establecidos a
nivel empresarial, los elementos de datos duplicados o inconsistentes deben
reducirse al mínimo. La mayoría de los problemas de calidad de los datos se
derivan de los errores durante la captura de los datos. Con frecuencia, el
análisis de la calidad de los datos empieza con una auditoría de calidad de los datos, la cual es una encuesta
estructurada de la precisión y el nivel de su integridad en un sistema de
información.
La limpieza de datos consiste en actividades para detectar y corregir datos en una
base que sean incorrectos, incompletos, que tengan un formato inapropiado o que
sean redundantes. La limpieza de datos no sólo corrige los errores, sino que
también impone la consistencia entre los distintos conjuntos de datos que se
originan en sistemas de información separados.
Los problemas de calidad de los
datos no son sólo problemas de negocios, también representan serios problemas
para los individuos, en cuanto a que afectan su condición financiera e incluso
sus empleos.
Bibliografía
Laudon, Kenneth C. y Laudon, Jane P.
(2012) Sistemas de información gerencial
Decimosegunda edición PEARSON EDUCACIÓN,
México, 2012.
No hay comentarios.:
Publicar un comentario