无码视频在线观看,99人妻,国产午夜视频,久久久久国产一级毛片高清版新婚

  • 始創(chuàng)于2000年 股票代碼:831685
    咨詢熱線:0371-60135900 注冊有禮 登錄
    • 掛牌上市企業(yè)
    • 60秒人工響應(yīng)
    • 99.99%連通率
    • 7*24h人工
    • 故障100倍補(bǔ)償
    全部產(chǎn)品
    您的位置: 網(wǎng)站首頁 > 幫助中心>文章內(nèi)容

    數(shù)據(jù)質(zhì)量管理:數(shù)據(jù)中心優(yōu)化必修課

    發(fā)布時(shí)間:  2012/8/31 17:20:42

    數(shù)據(jù)是企業(yè)數(shù)據(jù)中心的重要資產(chǎn),獲取并維護(hù)高質(zhì)量數(shù)據(jù),對高效的IT和業(yè)務(wù)運(yùn)營至關(guān)重要。面對復(fù)雜度不斷增加的業(yè)務(wù)數(shù)據(jù),如何全面保證數(shù)據(jù)質(zhì)量?借助完備的Informatica數(shù)據(jù)質(zhì)量平臺,無論何時(shí)何地,您都可以在整個(gè)企業(yè)內(nèi)訪問,甄別、清洗、集成、交付可信的數(shù)據(jù),并在第一時(shí)間找出并修正藏匿于任意位置、令您的公司動輒花費(fèi)上百萬的數(shù)據(jù)質(zhì)量問題。

    Informatica的數(shù)據(jù)管理目標(biāo)

    您心目中企業(yè)數(shù)據(jù)的價(jià)值幾何?調(diào)查顯示,信息的價(jià)值平均為企業(yè)價(jià)值的37%,可以說,信息已經(jīng)成為企業(yè)最重要的資產(chǎn)之一,越來越多的企業(yè)更加重視數(shù)據(jù)中心的建設(shè)。但有許多因素會導(dǎo)致這些“資產(chǎn)”貶值,比如數(shù)據(jù)的冗余和重復(fù)導(dǎo)致信息的不可識別、不可信,信息時(shí)效性不強(qiáng),精確度不夠;結(jié)構(gòu)或非結(jié)構(gòu)數(shù)據(jù)使整合有困難;管理層面的人員變動引發(fā)的影響;數(shù)據(jù)標(biāo)準(zhǔn)不能統(tǒng)一,相關(guān)規(guī)范不完善造成對數(shù)據(jù)理解的不充分等等。

    Informatica既可以在數(shù)據(jù)架構(gòu)層面提供信息傳遞、B2B數(shù)據(jù)交換、企業(yè)數(shù)據(jù)集成等一系列的基礎(chǔ)架構(gòu)解決方案,同時(shí)也可為行業(yè)提供數(shù)據(jù)質(zhì)量管理、主數(shù)據(jù)管理和復(fù)雜事件處理等方案,來支撐數(shù)據(jù)中心實(shí)現(xiàn)可信、交互、權(quán)威的信息資產(chǎn)管理,達(dá)成企業(yè)的業(yè)務(wù)目標(biāo),這也是信息中心建設(shè)的一個(gè)重點(diǎn)。


     
    數(shù)據(jù)質(zhì)量管理的整體框架

    數(shù)據(jù)質(zhì)量管理在數(shù)據(jù)中心建設(shè)中是一個(gè)完整的生態(tài)鏈。數(shù)據(jù)質(zhì)量會受到供應(yīng)商、生產(chǎn)員工、工藝流程以及內(nèi)部客戶和外部一些系統(tǒng)的影響,同時(shí),從應(yīng)用和軟件角度方面講,數(shù)據(jù)提供者、軟件開發(fā)集成、質(zhì)量管控手段等也都會影響到企業(yè)數(shù)據(jù)質(zhì)量的整體狀況。

    從數(shù)據(jù)質(zhì)量整體框架和方法論上講,首先我們要確定目標(biāo),然后要清楚用什么人,通過怎樣的流程,采用什么樣的技術(shù)支撐來達(dá)成目標(biāo),人、流程、技術(shù)三方面缺一不可。而設(shè)定最終目標(biāo)前最重要的一件事是要了解現(xiàn)狀,找出企業(yè)最關(guān)注哪些數(shù)據(jù)質(zhì)量,通過記分卡對現(xiàn)有數(shù)據(jù)進(jìn)行評估,同時(shí)還要進(jìn)行實(shí)時(shí)的監(jiān)控,從流程、時(shí)間角度發(fā)現(xiàn)數(shù)據(jù)的變化,了解現(xiàn)狀后確定的目標(biāo)才是可信、可完成的,而不是天方夜譚式的水中月、霧中花。

    數(shù)據(jù)質(zhì)量理論上不是完全可控的,要實(shí)現(xiàn)數(shù)據(jù)質(zhì)量提升,必須要做到指標(biāo)的可量化,通過量化指標(biāo)實(shí)現(xiàn)質(zhì)量可控。從技術(shù)層面講,要從以下六個(gè)角度去考量數(shù)據(jù)質(zhì)量,也稱為數(shù)據(jù)質(zhì)量的矩陣,包括:完備性(信息是否填寫全面)、符合性(數(shù)據(jù)是否按照標(biāo)準(zhǔn)格式進(jìn)行填寫)、一致性(是指內(nèi)部沖突,同一系統(tǒng)中兩個(gè)字段間相關(guān)推導(dǎo)和約束關(guān)系)、準(zhǔn)確性(包括數(shù)據(jù)是否真實(shí)有效和數(shù)據(jù)是否及時(shí)更新)、唯一性(多條信息是否相同和一致)以及完整性(從約束性和參考性方面考慮,數(shù)據(jù)相互間的參照關(guān)系)。當(dāng)然,企業(yè)是要根據(jù)自己的業(yè)務(wù)需求來確定考量數(shù)據(jù)質(zhì)量的指標(biāo)或體系,并不一定必須局限在這六個(gè)方面。

    構(gòu)建數(shù)據(jù)質(zhì)量處理流程

    一個(gè)完整的數(shù)據(jù)質(zhì)量管理,是人、流程和技術(shù)的完美配合,才能達(dá)到我們數(shù)據(jù)質(zhì)量管理的目標(biāo)。那數(shù)據(jù)質(zhì)量處理的流程是怎樣的呢?對于數(shù)據(jù)質(zhì)量的處理,我們把它分成兩大部分,一是面向數(shù)據(jù)質(zhì)量的分析過程,二是針對分析結(jié)果進(jìn)行增強(qiáng)的過程。先要識別和量化數(shù)據(jù)質(zhì)量,然后定義數(shù)據(jù)質(zhì)量和目標(biāo),接下來就要交給相關(guān)部門設(shè)計(jì)質(zhì)量提升的流程,其后就是實(shí)現(xiàn)質(zhì)量提升的流程,把原有低質(zhì)量數(shù)據(jù)變成高質(zhì)量數(shù)據(jù),并交付給業(yè)務(wù)人員使用。同時(shí),在整個(gè)環(huán)境中,還需要有相關(guān)的一些監(jiān)控和對比來評估是否達(dá)成了目標(biāo),決定是否需要進(jìn)行新一輪的數(shù)據(jù)質(zhì)量提升。這是一個(gè)周而復(fù)始、螺旋上升的過程,并不是一蹴而就,一次就可以解決全部問題。

    通過Informatica構(gòu)建數(shù)據(jù)質(zhì)量管理主要分為四大部分。首先是Analyze andPrfiling,通過對現(xiàn)有數(shù)據(jù)的詳細(xì)分析、描繪,來確定怎樣對他進(jìn)行處理和標(biāo)準(zhǔn)化;第二是Standardise\Cleanse,標(biāo)準(zhǔn)化和清洗更容易讓計(jì)算機(jī)識別,比如數(shù)據(jù)可以通過什么樣的格式進(jìn)行限制和約束,進(jìn)行怎樣的交驗(yàn)就可以達(dá)到數(shù)據(jù)標(biāo)準(zhǔn)的要求,那些信息可以通過數(shù)據(jù)質(zhì)點(diǎn)或者參考數(shù)據(jù)進(jìn)行相關(guān)的標(biāo)準(zhǔn)化;第三是Match,標(biāo)準(zhǔn)化后要進(jìn)行相關(guān)的數(shù)據(jù)匹配,解決數(shù)據(jù)重復(fù)性問題,并保證數(shù)據(jù)的唯一性;第四是Consolidate,將重復(fù)數(shù)據(jù)進(jìn)行合并,最后運(yùn)用到不同的系統(tǒng)當(dāng)中。需要注意的是,在整個(gè)過程中我們都需要進(jìn)行相關(guān)的監(jiān)控。在我們?nèi)粘?shù)據(jù)中心的建設(shè)中,也可以對這幾部分進(jìn)行相關(guān)的延展或者精簡來完善我們數(shù)據(jù)質(zhì)量管理的過程。

    這里重點(diǎn)介紹一下Informatica最具特色的模糊匹配技術(shù)。在數(shù)據(jù)匹配關(guān)聯(lián)中,可以用到不同的匹配關(guān)聯(lián)技術(shù),比如在實(shí)現(xiàn)數(shù)據(jù)的精確快速匹配時(shí),可以先對數(shù)據(jù)進(jìn)行預(yù)覽,查看兩個(gè)數(shù)據(jù)的可匹配度是多少,再進(jìn)行分析來確定這種匹配是否適用于此種數(shù)據(jù)的匹配過程。如沒有精確匹配來保證匹配率,則可以采用模糊比對的方法,比如下圖中,在人名比對中,可能因?yàn)槠匆艉、繁體輸入問題造成一個(gè)人的數(shù)據(jù)信息不一致,王門騫的“騫”,一個(gè)是簡體,一個(gè)是繁體,這兩個(gè)字在計(jì)算機(jī)編碼中并不一致,所以他們的名稱并不相等,這時(shí)就要對他的名字進(jìn)行模糊匹配打分,通過結(jié)果來分辯數(shù)據(jù)的可信度。比如設(shè)定0.8以上的數(shù)據(jù)為可信,那第兩條王門騫就是可信的同一個(gè)人,而第二條陳東壁被判定不是同一個(gè)人。

    現(xiàn)在,很多企業(yè)的數(shù)據(jù)中心,不僅僅只是一個(gè)最單純的面向數(shù)據(jù)倉庫的數(shù)據(jù)存儲中心,而是既能支持業(yè)務(wù)運(yùn)營,又支持系統(tǒng)分析,還可進(jìn)行系統(tǒng)間的整合。在數(shù)據(jù)中心建設(shè)中,數(shù)據(jù)質(zhì)量需要從數(shù)據(jù)源端就開始進(jìn)行治理,治理到業(yè)務(wù)交互的各個(gè)過程。包括PowerCenter、Data Quality、MDM Hub、Informatica 9在內(nèi)的Informatica的數(shù)據(jù)質(zhì)量工具,可以將所有的業(yè)務(wù)邏輯和規(guī)則變成相關(guān)的一些服務(wù),由各個(gè)業(yè)務(wù)前端、各個(gè)業(yè)務(wù)處理過程中,對數(shù)據(jù)服務(wù)進(jìn)行調(diào)用,進(jìn)行相關(guān)的數(shù)據(jù)校驗(yàn)和數(shù)據(jù)清洗,這就是Informatica數(shù)據(jù)質(zhì)量平臺為企業(yè)數(shù)據(jù)中心建設(shè)所提供的支持和幫助。讓我們可信的數(shù)據(jù)大廈從現(xiàn)在開始構(gòu)建!


    本文出自:億恩科技【mszdt.com】

    服務(wù)器租用/服務(wù)器托管中國五強(qiáng)!虛擬主機(jī)域名注冊頂級提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM]

  • 您可能在找
  • 億恩北京公司:
  • 經(jīng)營性ICP/ISP證:京B2-20150015
  • 億恩鄭州公司:
  • 經(jīng)營性ICP/ISP/IDC證:豫B1.B2-20060070
  • 億恩南昌公司:
  • 經(jīng)營性ICP/ISP證:贛B2-20080012
  • 服務(wù)器/云主機(jī) 24小時(shí)售后服務(wù)電話:0371-60135900
  • 虛擬主機(jī)/智能建站 24小時(shí)售后服務(wù)電話:0371-60135900
  • 專注服務(wù)器托管17年
    掃掃關(guān)注-微信公眾號
    0371-60135900
    Copyright© 1999-2019 ENKJ All Rights Reserved 億恩科技 版權(quán)所有  地址:鄭州市高新區(qū)翠竹街1號總部企業(yè)基地億恩大廈  法律顧問:河南亞太人律師事務(wù)所郝建鋒、杜慧月律師   京公網(wǎng)安備41019702002023號
      1
     
     
     
     

    0371-60135900
    7*24小時(shí)客服服務(wù)熱線