開(kāi)關(guān)電源廠家口若懸河講面向智能電網(wǎng)應(yīng)用的電力大數(shù)據(jù)關(guān)鍵技術(shù)

大數(shù)據(jù)這個(gè)術(shù)語(yǔ)最早期的引用可追溯到Apache軟件基金會(huì)的開(kāi)源項(xiàng)目Nutch。當(dāng)時(shí),大數(shù)據(jù)用來(lái)描述為更新網(wǎng)絡(luò)搜索索引需要同時(shí)進(jìn)行批量處理或分析的大量數(shù)據(jù)集。

  早在2008 年Nature就出版了專(zhuān)刊“Big Data”,從網(wǎng)絡(luò)經(jīng)濟(jì)學(xué)、超級(jí)計(jì)算、互聯(lián)網(wǎng)技術(shù)、生物醫(yī)藥、環(huán)境科學(xué)等多個(gè)方面介紹了海量數(shù)據(jù)帶來(lái)的挑戰(zhàn);2011年Science推出數(shù)據(jù)處理的專(zhuān)刊“Dealing With Data”,深入討論了數(shù)據(jù)洪流(datadeluge,DD)所帶來(lái)的挑戰(zhàn),并指出如果能夠更有效地組織和利用這些海量數(shù)據(jù),人們將得到更多的機(jī)會(huì)發(fā)揮科學(xué)技術(shù)對(duì)推動(dòng)社會(huì)發(fā)展的巨大作用;2012年奧巴馬宣布美國(guó)政府投資2億美元啟動(dòng)“大數(shù)據(jù)研究和發(fā)展計(jì)劃”,將大數(shù)據(jù)比喻為“未來(lái)的新石油”,將對(duì)大數(shù)據(jù)的研究上升為國(guó)家意志,掀起了世界各國(guó)大數(shù)據(jù)的研究熱潮。

  大數(shù)據(jù)的定義,業(yè)界雖然有一些共識(shí),但是并未有統(tǒng)一的定義。麥肯錫認(rèn)為“大數(shù)據(jù)是指其大小超出典型數(shù)據(jù)軟件抓取、儲(chǔ)存、管理和分析范圍的數(shù)據(jù)集合”;Gartner認(rèn)為“大數(shù)據(jù)是需要新處理模式才能具有更強(qiáng)的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長(zhǎng)率和多樣化的信息資產(chǎn)”。

  在對(duì)大數(shù)據(jù)的定義中,比較有代表性的定義是3V定義,即規(guī)模性(Volume),多樣性(Variety)和高速性(Velocity),規(guī)模性是指數(shù)據(jù)量龐大,數(shù)據(jù)洪流已經(jīng)從GB、TB級(jí)上升到PB、EB、ZB級(jí);多樣性是指數(shù)據(jù)類(lèi)型繁多,并且包含結(jié)構(gòu)化、半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù);高速性則是指數(shù)據(jù)以數(shù)據(jù)流的形態(tài)快速、動(dòng)態(tài)的產(chǎn)生,數(shù)據(jù)處理的速度也必須達(dá)到高速實(shí)時(shí)處理。

  另外大數(shù)據(jù)第4V的討論并沒(méi)有取得一致的結(jié)論,國(guó)際數(shù)據(jù)公司(international data corporation, IDC)認(rèn)為大數(shù)據(jù)應(yīng)該具有價(jià)值性(Value),且價(jià)值密度稀疏;IBM則認(rèn)為大數(shù)據(jù)的第4V特性是真實(shí)性(Veracity)。大數(shù)據(jù)的這些特點(diǎn)決定了在大數(shù)據(jù)時(shí)代,傳統(tǒng)的數(shù)據(jù)處理技術(shù)必需有革命性的提升。

  電力系統(tǒng)作為經(jīng)濟(jì)發(fā)展和人類(lèi)生活依賴(lài)的能量供給系統(tǒng),也具有大數(shù)據(jù)的典型特征。電力系統(tǒng)是最復(fù)雜的人造系統(tǒng)之一,其具有地理位置分布廣泛、發(fā)電用電實(shí)時(shí)平衡、傳輸能量數(shù)量龐大、電能傳輸光速可達(dá)、通訊調(diào)度高度可靠、實(shí)時(shí)運(yùn)行從不停止、重大故障瞬間擴(kuò)大等特點(diǎn),這些特點(diǎn)決定了電力系統(tǒng)運(yùn)行時(shí)產(chǎn)生的數(shù)據(jù)數(shù)量龐大、增長(zhǎng)快速、類(lèi)型豐富,完全符合大數(shù)據(jù)的所有特征,是典型的大數(shù)據(jù)。

  在智能電網(wǎng)深入推進(jìn)的形勢(shì)下,電力系統(tǒng)的數(shù)字化、信息化、智能化不斷發(fā)展,帶來(lái)了更多的數(shù)據(jù)源,例如智能電表從數(shù)以?xún)|計(jì)的家庭和企業(yè)終端帶來(lái)的數(shù)據(jù),電力設(shè)備狀態(tài)監(jiān)測(cè)系統(tǒng)從數(shù)以萬(wàn)計(jì)的發(fā)電機(jī)、變壓器、開(kāi)關(guān)設(shè)備、架空線路、高壓電纜等設(shè)備中獲取的高速增長(zhǎng)的監(jiān)測(cè)數(shù)據(jù),光伏和風(fēng)電功率預(yù)測(cè)所需的大量的歷史運(yùn)行數(shù)據(jù)、氣象觀測(cè)數(shù)據(jù)等。

  因此在電力系統(tǒng)數(shù)據(jù)爆炸式增長(zhǎng)的新形勢(shì)下,傳統(tǒng)的數(shù)據(jù)處理技術(shù)遇到瓶頸,不能滿足電力行業(yè)從海量數(shù)據(jù)中快速獲取知識(shí)與信息的分析需求,電力大數(shù)據(jù)技術(shù)的應(yīng)用是電力行業(yè)信息化、智能化發(fā)展的必然要求。

  中國(guó)電機(jī)工程學(xué)會(huì)信息化專(zhuān)委會(huì)在2013年3月發(fā)布了《中國(guó)電力大數(shù)據(jù)發(fā)展白皮書(shū)》,將2013 年定為“中國(guó)大數(shù)據(jù)元年”,掀起了電力大數(shù)據(jù)的研究熱潮。根據(jù)白皮書(shū)描述,電力大數(shù)據(jù)的特征可概括為3V和3E。3V為體量大(Volume)、速度快(Velocity)和類(lèi)型多(Variety) ; 3E 為數(shù)據(jù)即能量(Energy) 、數(shù)據(jù)即交互(Exchange)和數(shù)據(jù)即共情(Empathy)。

  其3V的描述和其他行業(yè)的描述比較接近,3E的描述具有典型的電力行業(yè)特征,體現(xiàn)了大數(shù)據(jù)在電力系統(tǒng)應(yīng)用中的巨大價(jià)值。數(shù)據(jù)即能量簡(jiǎn)而言之,就是指通過(guò)大數(shù)據(jù)分析達(dá)到節(jié)能的目的,電力大數(shù)據(jù)應(yīng)用的過(guò)程,就是電力數(shù)據(jù)能量釋放的過(guò)程;數(shù)據(jù)即交互是指電力大數(shù)據(jù)與國(guó)民經(jīng)濟(jì)其他領(lǐng)域數(shù)據(jù)進(jìn)行交互融合,才能發(fā)揮其更大價(jià)值;數(shù)據(jù)即共情是指電力大數(shù)據(jù)緊密聯(lián)系千家萬(wàn)戶(hù)、廠礦企業(yè),只有情系用電客戶(hù),滿足客戶(hù)需求,電力企業(yè)方能以數(shù)據(jù)取勝。

  電力大數(shù)據(jù)貫穿發(fā)、輸、變、配、用等電力生產(chǎn)及管理的各個(gè)環(huán)節(jié),是能源變革中電力工業(yè)技術(shù)革新的必然過(guò)程,不僅是技術(shù)上的進(jìn)步,更是涉及電力系統(tǒng)管理體制、發(fā)展理念和技術(shù)路線等方面的重大變革,是下一代電力系統(tǒng)在大數(shù)據(jù)時(shí)代下價(jià)值形態(tài)的躍升。對(duì)建設(shè)堅(jiān)強(qiáng)智能電網(wǎng)而言,亟需開(kāi)展大數(shù)據(jù)相關(guān)技術(shù)的研究,為電力大數(shù)據(jù)時(shí)代的到來(lái)奠定理論基礎(chǔ)和技術(shù)積累。

    1 智能電網(wǎng)、云計(jì)算和大數(shù)據(jù)的關(guān)系







  1.1 智能電網(wǎng)與大數(shù)據(jù)的關(guān)系

  智能電網(wǎng)就是將信息技術(shù)、計(jì)算機(jī)技術(shù)、通信技術(shù)和原有輸、配電基礎(chǔ)設(shè)施高度集成而形成的新型電網(wǎng),具有提高能源效率、提高供電安全性、減少環(huán)境影響、提高供電可靠性、減少輸電網(wǎng)電能損耗等優(yōu)點(diǎn)。

  智能電網(wǎng)的理念是通過(guò)獲取更多的用戶(hù)如何用電、怎樣用電的信息,來(lái)優(yōu)化電的生產(chǎn)、分配及消耗,利用現(xiàn)代網(wǎng)絡(luò)、通信和信息技術(shù)進(jìn)行信息海量交互,來(lái)實(shí)現(xiàn)電網(wǎng)設(shè)備間信息交換,并自動(dòng)完成信息采集、測(cè)量、控制、保護(hù)、計(jì)量和監(jiān)測(cè)等基本功能,可根據(jù)需要支持電網(wǎng)實(shí)時(shí)自動(dòng)化控制、智能調(diào)節(jié)、在線分析決策和協(xié)同互動(dòng)等高級(jí)功能,因此相關(guān)研究者指出:可以抽象的認(rèn)為,智能電網(wǎng)就是大數(shù)據(jù)這個(gè)概念在電力行業(yè)中的應(yīng)用。

  1.2 大數(shù)據(jù)與云計(jì)算的關(guān)系

  根據(jù)美國(guó)國(guó)家標(biāo)準(zhǔn)與技術(shù)研究院的定義,云計(jì)算是一種利用互聯(lián)網(wǎng)實(shí)現(xiàn)隨時(shí)、隨地、按需、便捷地訪問(wèn)共享資源池(如計(jì)算設(shè)施、應(yīng)用程序、存儲(chǔ)設(shè)備等)的計(jì)算模式。

  從技術(shù)上看,大數(shù)據(jù)根植于云計(jì)算,云計(jì)算的數(shù)據(jù)存儲(chǔ)、管理與分析方面的技術(shù)是大數(shù)據(jù)技術(shù)的基礎(chǔ)。利用云計(jì)算強(qiáng)大的計(jì)算能力,可以更加迅速地處理大數(shù)據(jù),并更方便地提供服務(wù);通過(guò)大數(shù)據(jù)的業(yè)務(wù)需求,可以為云計(jì)算的發(fā)展找到更多更好的實(shí)際應(yīng)用。

  云計(jì)算使大數(shù)據(jù)應(yīng)用成為可能,但是沒(méi)有大數(shù)據(jù)的信息沉淀,云計(jì)算的功能將得不到完全發(fā)揮,所以從整體上看,大數(shù)據(jù)與云計(jì)算是相輔相成的。

  云計(jì)算和大數(shù)據(jù)的側(cè)重點(diǎn)不同,因此也有較大的差別。大數(shù)據(jù)關(guān)注重心在于數(shù)據(jù)背后的信息沉淀與業(yè)務(wù)分析,因此其推動(dòng)力量來(lái)源于擁有大數(shù)據(jù)的企業(yè)和軟件廠商;云計(jì)算關(guān)注重心在于計(jì)算能力,偏重于技術(shù)解決方案,因此其推動(dòng)力量來(lái)自于計(jì)算資源和存儲(chǔ)資源的生產(chǎn)廠商。

  云計(jì)算技術(shù)的發(fā)展早于大數(shù)據(jù)技術(shù)的發(fā)展,但是大數(shù)據(jù)的業(yè)務(wù)需求又為云計(jì)算技術(shù)的發(fā)展帶來(lái)新的機(jī)遇,一方面促進(jìn)了云計(jì)算技術(shù)向更加貼近用戶(hù)需求的方向發(fā)展,另一方面帶來(lái)了更高處理速度、更大存儲(chǔ)容量的要求。

  1.3 智能電網(wǎng)、云計(jì)算、大數(shù)據(jù)的相互關(guān)系

  云計(jì)算能夠整合智能電網(wǎng)系統(tǒng)內(nèi)部計(jì)算處理和存儲(chǔ)資源,提高電網(wǎng)處理和交互能力,成為電網(wǎng)強(qiáng)有力的技術(shù)組成;大數(shù)據(jù)技術(shù)立足于業(yè)務(wù)服務(wù)需求,根植于云計(jì)算,以云計(jì)算技術(shù)為基礎(chǔ);智能電網(wǎng)可以抽象的認(rèn)為是大數(shù)據(jù)這個(gè)概念在電力中的應(yīng)用,所以三者是彼此交互的關(guān)系。

  智能電網(wǎng)、云計(jì)算、大數(shù)據(jù)三者之間的關(guān)系,從更加深層次來(lái)講,是電力系統(tǒng)發(fā)展到不同階段的產(chǎn)物,具有代紀(jì)傳承的特點(diǎn)。

      智能電網(wǎng)是信息技術(shù)、計(jì)算機(jī)技術(shù)、人工智能技術(shù)等在傳統(tǒng)電網(wǎng)上應(yīng)用沉淀的結(jié)果,滿足電網(wǎng)信息化、智能化、清潔化等高層次的運(yùn)營(yíng)和管理需求,既是對(duì)傳統(tǒng)電網(wǎng)的繼承,也是對(duì)傳統(tǒng)電網(wǎng)的發(fā)揚(yáng),所以其發(fā)展必然與新技術(shù)同步。

  來(lái)自于計(jì)算機(jī)和信息技術(shù)領(lǐng)域最前沿的云計(jì)算技術(shù)和大數(shù)據(jù)技術(shù),正是其發(fā)展階段技術(shù)層面和應(yīng)用層面兩個(gè)具有劃時(shí)代意義的新技術(shù)。云計(jì)算技術(shù)中的分布式存儲(chǔ)技術(shù)和并行計(jì)算技術(shù),滿足了電網(wǎng)海量數(shù)據(jù)的存儲(chǔ)和計(jì)算需求,因此云計(jì)算技術(shù)推出不久,電力云的概念就提出來(lái),云計(jì)算技術(shù)在電力系統(tǒng)中的應(yīng)用也逐漸呈現(xiàn)出百花齊放的態(tài)勢(shì),推動(dòng)了智能電網(wǎng)的發(fā)展。

  大數(shù)據(jù)技術(shù)既是傳統(tǒng)數(shù)據(jù)分析與挖掘技術(shù)的延續(xù),也是數(shù)據(jù)量級(jí)增長(zhǎng)到一定階段時(shí)知識(shí)挖掘與業(yè)務(wù)應(yīng)用需求的必然產(chǎn)物,因此大數(shù)據(jù)技術(shù)的大部分應(yīng)用都以云計(jì)算的關(guān)鍵技術(shù)或者與云計(jì)算類(lèi)似的分布式存儲(chǔ)和處理技術(shù)為基礎(chǔ)。電力大數(shù)據(jù)技術(shù)的發(fā)展從某種意義上講,可以看成是云計(jì)算技術(shù)在智能電網(wǎng)中,高級(jí)業(yè)務(wù)需求的實(shí)現(xiàn)過(guò)程。

  2 電力大數(shù)據(jù)平臺(tái)的總體架構(gòu)

  Apache基金會(huì)開(kāi)源技術(shù)通用的大數(shù)據(jù)平臺(tái)整體架構(gòu)具有較好的通用性,適用于電力企業(yè)大數(shù)據(jù)的規(guī)劃,其主要思想是利用基于Hadoop文件系統(tǒng)(Hadoopdistributed file system,HDFS)的分布式文件處理系統(tǒng)作為大數(shù)據(jù)的存儲(chǔ)框架,利用基于MapReduce的分布式計(jì)算技術(shù)作為大數(shù)據(jù)的處理框架。

  以分布式文件處理技術(shù)為基礎(chǔ),使PB、ZB級(jí)的數(shù)據(jù)存儲(chǔ)成為可能;以分布式計(jì)算技術(shù)為基礎(chǔ),使得PB、ZB級(jí)數(shù)據(jù)的查詢(xún)分析成為可能。另外該框架中還包含商業(yè)智能應(yīng)用、傳統(tǒng)的數(shù)據(jù)倉(cāng)庫(kù)、大數(shù)據(jù)訪問(wèn)框架、大數(shù)據(jù)調(diào)度框架、網(wǎng)絡(luò)層、操作系統(tǒng)、服務(wù)器、備份和恢復(fù)、數(shù)據(jù)管理等模塊。

  大數(shù)據(jù)存儲(chǔ)框架和大數(shù)據(jù)處理框架通常構(gòu)建在通用的服務(wù)器、操作系統(tǒng)或者虛擬機(jī)上,使得該架構(gòu)所需的硬件具有低成本和高擴(kuò)展性的特點(diǎn),標(biāo)準(zhǔn)的普通服務(wù)器或者PC機(jī)即可成為基于該架構(gòu)的終端構(gòu)成單元。

  大數(shù)據(jù)存儲(chǔ)框架和大數(shù)據(jù)處理框架之上是通過(guò)網(wǎng)絡(luò)層連接的大數(shù)據(jù)訪問(wèn)框架,該訪問(wèn)框架包含并行計(jì)算機(jī)編程語(yǔ)言Pig、數(shù)據(jù)倉(cāng)庫(kù)工具Hive、開(kāi)源數(shù)據(jù)傳遞工具Sqoop 等子模塊。

  大數(shù)據(jù)調(diào)度框架包含基于列存儲(chǔ)的開(kāi)源非關(guān)系型數(shù)據(jù)庫(kù)Hbase、數(shù)據(jù)序列化格式與傳輸工具Avro、日志收集系統(tǒng)Flume、分布式鎖設(shè)施ZooKeeper等模塊。

  大數(shù)據(jù)調(diào)度框架實(shí)現(xiàn)了對(duì)大數(shù)據(jù)的組織與調(diào)度,為數(shù)據(jù)分析提供了必要條件。在大數(shù)據(jù)調(diào)度框架之上是企業(yè)級(jí)商業(yè)智能應(yīng)用系統(tǒng),可以開(kāi)展查詢(xún)、分析、統(tǒng)計(jì)、報(bào)表等高級(jí)應(yīng)用。大數(shù)據(jù)的管理、安全和備份恢復(fù)框架幫助進(jìn)行大數(shù)據(jù)的治理和保護(hù)。

  該框架幾乎涵蓋了大數(shù)據(jù)技術(shù)的所有環(huán)節(jié),值得指出的是,通過(guò)該訪問(wèn)框架不僅可以實(shí)現(xiàn)對(duì)分布式文件存儲(chǔ)系統(tǒng)的訪問(wèn),而且通過(guò)大數(shù)據(jù)連接器和開(kāi)源數(shù)據(jù)傳遞工具Sqoop可以實(shí)現(xiàn)對(duì)傳統(tǒng)數(shù)據(jù)倉(cāng)庫(kù)的訪問(wèn)。

  大數(shù)據(jù)的處理流程可以定義為在合適工具的輔助下,對(duì)廣泛異構(gòu)的數(shù)據(jù)源進(jìn)行抽取和集成,按照統(tǒng)一的標(biāo)準(zhǔn)對(duì)結(jié)果進(jìn)行存儲(chǔ),利用恰當(dāng)?shù)臄?shù)據(jù)分析技術(shù)對(duì)存儲(chǔ)的數(shù)據(jù)進(jìn)行分析,達(dá)到從中提取出有價(jià)值的知識(shí)的目的,并用合適的方式將結(jié)果展現(xiàn)給終端用戶(hù)。

  對(duì)電力企業(yè)來(lái)講,電力大數(shù)據(jù)的基本處理流程與傳統(tǒng)數(shù)據(jù)處理流程并無(wú)太大差異,主要區(qū)別在于:電力大數(shù)據(jù)需要處理大量、非結(jié)構(gòu)的數(shù)據(jù),所以在各個(gè)環(huán)節(jié)都可以采用MapReduce等方式進(jìn)行并行處理。

  電力系統(tǒng)是一種高維非線性的復(fù)雜系統(tǒng),其內(nèi)部的數(shù)據(jù)流包含電力流、信息流、業(yè)務(wù)流、故障流、氣象流等不同的數(shù)據(jù)流向。

  對(duì)這些電力系統(tǒng)的子信息源而言,一方面可以單獨(dú)應(yīng)用大數(shù)據(jù)技術(shù),提升其產(chǎn)業(yè)價(jià)值,例如電力設(shè)備在線監(jiān)測(cè)系統(tǒng)本身就是一個(gè)大數(shù)據(jù)系統(tǒng),另一方面可以融合不同的子信息源,在更高的層面上構(gòu)件大數(shù)據(jù)平臺(tái),例如融合電能計(jì)量系統(tǒng)、SCADA系統(tǒng)、MIS系統(tǒng)、負(fù)荷控制系統(tǒng),可以構(gòu)建基于大數(shù)據(jù)平臺(tái)的網(wǎng)損分析系統(tǒng),實(shí)現(xiàn)網(wǎng)損的自動(dòng)統(tǒng)計(jì)與分析。

  基于該網(wǎng)損分析大數(shù)據(jù)平臺(tái),還可開(kāi)展基于自動(dòng)網(wǎng)損統(tǒng)計(jì)的用戶(hù)竊電行為挖掘,實(shí)現(xiàn)更深層次的應(yīng)用。

      3 電力大數(shù)據(jù)關(guān)鍵技術(shù)

  3.1 電力大數(shù)據(jù)的集成管理技術(shù)

  電力企業(yè)數(shù)據(jù)集成管理技術(shù)是合并來(lái)自2個(gè)或者多個(gè)應(yīng)用系統(tǒng)的數(shù)據(jù),創(chuàng)建一個(gè)具有更多功能的企業(yè)應(yīng)用的過(guò)程。從集成的角度來(lái)說(shuō),就是把不同來(lái)源、格式、特點(diǎn)、性質(zhì)的數(shù)據(jù)在邏輯上或者存儲(chǔ)介質(zhì)上有機(jī)地集中,為系統(tǒng)存儲(chǔ)一系列面向主題的、集成的、相對(duì)穩(wěn)定的、反映歷史變化的數(shù)據(jù)集合,從而為系統(tǒng)提供全面的數(shù)據(jù)共享。電力企業(yè)集成管理技術(shù)就是為解決電力企業(yè)內(nèi)部各系統(tǒng)間的數(shù)據(jù)冗余和信息孤島而產(chǎn)生的。

  電力大數(shù)據(jù)的數(shù)據(jù)集成管理技術(shù),包含關(guān)系型和非關(guān)系型數(shù)據(jù)庫(kù)技術(shù)、數(shù)據(jù)融合和集成技術(shù)、數(shù)據(jù)抽取技術(shù)、過(guò)濾技術(shù)和數(shù)據(jù)清洗等。大數(shù)據(jù)的一個(gè)重要特點(diǎn)就是多樣性,這就意味著數(shù)據(jù)來(lái)源極其廣泛,數(shù)據(jù)類(lèi)型極為繁雜,這種復(fù)雜的數(shù)據(jù)環(huán)境給大數(shù)據(jù)的處理帶來(lái)極大的挑戰(zhàn),要想處理大數(shù)據(jù),首先必須對(duì)數(shù)據(jù)源的數(shù)據(jù)進(jìn)行抽取和集成,從中提取出實(shí)體和關(guān)系,經(jīng)過(guò)關(guān)聯(lián)和聚合之后采用統(tǒng)一的結(jié)構(gòu)來(lái)存儲(chǔ)這些數(shù)據(jù),在數(shù)據(jù)集成和提取時(shí)需要對(duì)數(shù)據(jù)進(jìn)行清洗,保證數(shù)據(jù)質(zhì)量及可靠性。

  大數(shù)據(jù)存儲(chǔ)管理中一個(gè)重要的技術(shù)是NoSQL數(shù)據(jù)庫(kù)技術(shù),它采用分布式數(shù)據(jù)存儲(chǔ)方式,去掉了關(guān)系型數(shù)據(jù)庫(kù)的關(guān)系型特性,數(shù)據(jù)存儲(chǔ)被簡(jiǎn)化且更加靈活,具有良好的可擴(kuò)展性,解決了海量數(shù)據(jù)的存儲(chǔ)難題。有代表性的NoSQL 數(shù)據(jù)庫(kù)技術(shù)有Google的BigTable和Amazon的Dynamo等。

  3.2 電力大數(shù)據(jù)的數(shù)據(jù)分析技術(shù)

  大數(shù)據(jù)技術(shù)的根本驅(qū)動(dòng)力是將信號(hào)轉(zhuǎn)化為數(shù)據(jù),將數(shù)據(jù)分析為信息,將信息提煉為知識(shí),以知識(shí)促成決策和行動(dòng)。借助電力大數(shù)據(jù)的分析技術(shù)可以從電力系統(tǒng)的海量數(shù)據(jù)中找出潛在的模態(tài)與規(guī)律,為決策人員提供決策支持。

  麥肯錫認(rèn)為可用于大數(shù)據(jù)分析的關(guān)鍵技術(shù)源于統(tǒng)計(jì)學(xué)和計(jì)算機(jī)科學(xué)等學(xué)科,包含關(guān)聯(lián)分析、機(jī)器學(xué)習(xí)、數(shù)據(jù)挖掘、模式識(shí)別、神經(jīng)網(wǎng)絡(luò)、時(shí)間序列預(yù)測(cè)模型、遺傳算法等多種不同的方法。

  大數(shù)據(jù)研究不同于傳統(tǒng)的邏輯推理研究,是對(duì)巨大數(shù)量的數(shù)據(jù)做統(tǒng)計(jì)性的搜索、分類(lèi)、比較、聚類(lèi)等的分析和歸納,因此繼承了統(tǒng)計(jì)科學(xué)的一些特點(diǎn),如統(tǒng)計(jì)學(xué)關(guān)注的數(shù)據(jù)相關(guān)性或稱(chēng)關(guān)聯(lián)性,所謂“相關(guān)性”是指2個(gè)或2個(gè)以上變量的取值之間存在某種規(guī)律性[7]!跋嚓P(guān)分析”的目的是找出數(shù)據(jù)集里隱藏的關(guān)系網(wǎng),一般用支持度、可信度、興趣度等參數(shù)反映相關(guān)性。

  牛津大學(xué)網(wǎng)絡(luò)學(xué)院教授維克多在他的著作《大數(shù)據(jù)時(shí)代》中指出:在大數(shù)據(jù)時(shí)代,相關(guān)關(guān)系分析法將大放異彩,通過(guò)找到一個(gè)良好現(xiàn)象的關(guān)聯(lián)物,相關(guān)關(guān)系分析可以捕獲現(xiàn)在和預(yù)測(cè)未來(lái)。大數(shù)據(jù)相關(guān)關(guān)系分析法,建立在海量樣本的基礎(chǔ)上,不采用隨機(jī)分析法這樣的捷徑,而采用分析所有數(shù)據(jù)的方法;大數(shù)據(jù)的簡(jiǎn)單算法比小數(shù)據(jù)的復(fù)雜算法更有效,其結(jié)果更快、更準(zhǔn)確而且不易受到干擾,因此他指出建立在相關(guān)關(guān)系分析法基礎(chǔ)上的預(yù)測(cè)是大數(shù)據(jù)的核心。

  大數(shù)據(jù)這種不注重因果關(guān)系側(cè)重于相關(guān)關(guān)系的分析方法,帶來(lái)了科學(xué)研究思維方式的重大轉(zhuǎn)變,已故圖靈獎(jiǎng)得主吉姆˙格雷提出的數(shù)據(jù)密集型科研“第四范式”,將大數(shù)據(jù)科研從前3 種范式(理論科學(xué)、計(jì)算科學(xué)、實(shí)驗(yàn)科學(xué))中分離出來(lái),單獨(dú)作為一種科研范式,正是因?yàn)槠溲芯糠绞讲煌诨跀?shù)學(xué)模型的傳統(tǒng)研究方式。

  電力大數(shù)據(jù)分析技術(shù),從根本上講,屬于傳統(tǒng)數(shù)據(jù)挖掘技術(shù)在海量數(shù)據(jù)挖掘下的新發(fā)展,但由于大數(shù)據(jù)海量、高速增長(zhǎng)、多樣性的特點(diǎn),并且不僅包含結(jié)構(gòu)化數(shù)據(jù),還含半結(jié)構(gòu)化和非機(jī)構(gòu)化數(shù)據(jù),因此傳統(tǒng)的很多處理小數(shù)據(jù)的數(shù)據(jù)挖掘方法已經(jīng)不再實(shí)用。

  大數(shù)據(jù)環(huán)境下的數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)算法,可以從3個(gè)方面著手:1)從大數(shù)據(jù)的治理與抽樣、特征選擇的角度入手,將大數(shù)據(jù)小數(shù)據(jù)化;2)開(kāi)展大數(shù)據(jù)下的聚類(lèi)、分類(lèi)算法研究,例如基于共軛度的最小二乘支持向量機(jī)(least squares support vector machine,LS-SVM)],隨機(jī)可擴(kuò)展FuzzyC-Means (FCM)等;3)開(kāi)展大數(shù)據(jù)的并行算法,將傳統(tǒng)的數(shù)據(jù)挖掘方法通過(guò)并行化,應(yīng)用到大數(shù)據(jù)的知識(shí)挖掘中,例如基于MapReduce的機(jī)器學(xué)習(xí)與知識(shí)挖掘。

  3.3 電力大數(shù)據(jù)的數(shù)據(jù)處理技術(shù)

  電力大數(shù)據(jù)的數(shù)據(jù)處理技術(shù)包括分布式計(jì)算技術(shù),內(nèi)存計(jì)算技術(shù),流處理技術(shù)等。分布式計(jì)算技術(shù)是為了解決大規(guī)模數(shù)據(jù)的分布式存儲(chǔ)與處理。內(nèi)存計(jì)算技術(shù)是為了解決數(shù)據(jù)的高效讀取和處理在線的實(shí)時(shí)計(jì)算。流處理技術(shù)則是為了處理實(shí)時(shí)到達(dá)的、速度和規(guī)模不受控制的數(shù)據(jù)。

  分布式計(jì)算是一種新的計(jì)算方式,研究如何將一個(gè)需要強(qiáng)大計(jì)算能力才能解決的問(wèn)題分解為許多小的部分,然后再將這些部分分給多個(gè)計(jì)算機(jī)處理,最后把結(jié)果綜合起來(lái)得到最終結(jié)果。

  分布式計(jì)算的一個(gè)典型代表是Google公司提出的MapReduce編程模型,該模型先將待處理的數(shù)據(jù)進(jìn)行分塊,交給不同的Map任務(wù)區(qū)處理,并按鍵值存儲(chǔ)到本地硬盤(pán),再用Reduce任務(wù)按照鍵值將結(jié)果匯總并輸出最終結(jié)果。分布式技術(shù)適用于電力系統(tǒng)信息采集領(lǐng)域的大規(guī)模分散數(shù)據(jù)源。

     內(nèi)存計(jì)算技術(shù)是將數(shù)據(jù)全部放在內(nèi)層中進(jìn)行操作的計(jì)算技術(shù),該技術(shù)克服了對(duì)磁盤(pán)讀寫(xiě)操作時(shí)的大量時(shí)間消耗,計(jì)算速度得到幾個(gè)數(shù)量級(jí)的大幅提升。內(nèi)層計(jì)算技術(shù)伴隨著大數(shù)據(jù)浪潮的來(lái)臨和內(nèi)存價(jià)格的下降得到快速的發(fā)展和廣泛的應(yīng)用,EMC、甲骨文、SAT都推出了內(nèi)存計(jì)算的解決方案,將客戶(hù)以前需要以天作為時(shí)間計(jì)算單位的業(yè)務(wù)降低為以秒作為時(shí)間計(jì)算單位,解決了大數(shù)據(jù)實(shí)時(shí)分析和知識(shí)挖掘的難題。

  流處理的處理模型是將源源不斷的數(shù)據(jù)組視為流,當(dāng)新的數(shù)據(jù)到來(lái)時(shí)就立即處理并返回結(jié)果,其基本理念是數(shù)據(jù)的價(jià)值會(huì)隨著時(shí)間的流逝而不斷減少,因此盡可能快地對(duì)最新的數(shù)據(jù)做出分析并給出結(jié)果,其應(yīng)用場(chǎng)景主要有網(wǎng)頁(yè)點(diǎn)擊的實(shí)時(shí)統(tǒng)計(jì)、傳感器網(wǎng)絡(luò)、金融中的高頻交易等[8]。

  隨著電力事業(yè)的發(fā)展,電力系統(tǒng)數(shù)據(jù)量不斷增長(zhǎng),對(duì)實(shí)時(shí)性的要求也越來(lái)越高,將數(shù)據(jù)流技術(shù)應(yīng)用于電力系統(tǒng)可以為決策者提供即時(shí)依據(jù),滿足實(shí)時(shí)在線分析需求。

  3.4 電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術(shù)

  電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術(shù)包括可視化技術(shù)、空間信息流展示技術(shù)、歷史流展示技術(shù)等?梢暬夹g(shù)、空間信息流展示技術(shù)、歷史流展示技術(shù)從3個(gè)不同的方面詮釋了電力大數(shù)據(jù)展現(xiàn)技術(shù)的豐富內(nèi)涵。借助電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術(shù)可幫助管理人員更直觀、準(zhǔn)確地理解電力系統(tǒng)數(shù)據(jù)表達(dá)的意義,了解電力系統(tǒng)的運(yùn)行狀態(tài)。

  可視化技術(shù)廣泛應(yīng)用于電網(wǎng)狀態(tài)的實(shí)時(shí)監(jiān)控,顯著提高了電力系統(tǒng)的自動(dòng)化水平。未來(lái)電力系統(tǒng)可視化還可結(jié)合復(fù)雜網(wǎng)絡(luò)中的相關(guān)理論在電網(wǎng)自動(dòng)分層分區(qū)、自動(dòng)布點(diǎn)等方面展開(kāi)深入研究,發(fā)掘電網(wǎng)更深層次的規(guī)律和聯(lián)系。

  空間信息流展示技術(shù)主要體現(xiàn)在電網(wǎng)參數(shù)與已有地理信息系統(tǒng)的結(jié)合上,包含變電站三維展示、虛擬現(xiàn)實(shí)等技術(shù)。將電力配電設(shè)備管理與地理信息系統(tǒng)緊密結(jié)合起來(lái),有利于電網(wǎng)管理人員直觀地了解設(shè)備情況,從而為其決策提供最新的地理信息。在變電站工程設(shè)計(jì)中用空間信息流展示技術(shù)可以節(jié)約時(shí)間、資源、成本,為電力企業(yè)帶來(lái)巨大的效益。

  歷史流展示技術(shù)體現(xiàn)在對(duì)電網(wǎng)歷史數(shù)據(jù)的管理與展示上。在電力系統(tǒng)中,深層次的應(yīng)用分析往往以歷史數(shù)據(jù)為基礎(chǔ)。對(duì)生產(chǎn)現(xiàn)場(chǎng)的實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù)、電網(wǎng)的規(guī)劃數(shù)據(jù)和負(fù)荷預(yù)測(cè)數(shù)據(jù),通過(guò)歷史流展示技術(shù),可以繪制出數(shù)據(jù)的發(fā)展趨勢(shì)并預(yù)測(cè)出未來(lái)的數(shù)據(jù)走勢(shì);通過(guò)歷史流回放展示技術(shù),可以模擬歷史重大事件發(fā)生、演變,挖掘歷史事件潛在的知識(shí)與規(guī)律。

  4 大數(shù)據(jù)在智能電網(wǎng)中的應(yīng)用

  電力大數(shù)據(jù)的應(yīng)用場(chǎng)合涵蓋發(fā)、輸、變、配、用、調(diào)等電力行業(yè)的各個(gè)環(huán)節(jié),在風(fēng)電場(chǎng)選址、降低網(wǎng)損、風(fēng)電并網(wǎng)、電網(wǎng)安全監(jiān)測(cè)、大災(zāi)難預(yù)警、電力企業(yè)精細(xì)化運(yùn)營(yíng)、電力設(shè)備狀態(tài)監(jiān)測(cè)等領(lǐng)域有非常強(qiáng)的可實(shí)現(xiàn)性。

  5 結(jié)論與展望

  本文探討了大數(shù)據(jù)、云計(jì)算、智能電網(wǎng)三者之間的相互關(guān)系,并給出電力大數(shù)據(jù)的總體可執(zhí)行框架,對(duì)電力企業(yè)大數(shù)據(jù)平臺(tái)的搭建具有參考價(jià)值。

  本文闡述了電力大數(shù)據(jù)平臺(tái)中4個(gè)核心的關(guān)鍵技術(shù),即集成管理技術(shù)、分析技術(shù)、處理技術(shù)、展現(xiàn)技術(shù)。大數(shù)據(jù)的集成管理技術(shù)應(yīng)該考慮關(guān)系型和非關(guān)系型數(shù)據(jù)庫(kù)技術(shù)的綜合應(yīng)用,并重點(diǎn)考慮NoSQL數(shù)據(jù)庫(kù)技術(shù);大數(shù)據(jù)的分析技術(shù)應(yīng)從大數(shù)據(jù)的治理與抽樣、大數(shù)據(jù)特征選擇、大數(shù)據(jù)小數(shù)據(jù)化、大數(shù)據(jù)的分類(lèi)算法、大數(shù)據(jù)挖掘并行化等方面開(kāi)展研究;大數(shù)據(jù)的處理技術(shù)應(yīng)根據(jù)具體的應(yīng)用需求考慮分布式計(jì)算、內(nèi)存計(jì)算、流處理等技術(shù);電力大數(shù)據(jù)的數(shù)據(jù)展現(xiàn)技術(shù)可考慮可視化技術(shù)、空間信息流展示技術(shù)、歷史流展示技術(shù)等。

  大數(shù)據(jù)技術(shù)在商業(yè)領(lǐng)域已經(jīng)獲得較為廣泛的應(yīng)用并創(chuàng)造出巨大的商業(yè)價(jià)值,但是在電力系統(tǒng)中的應(yīng)用才剛剛起步,因此結(jié)合大數(shù)據(jù)的技術(shù)優(yōu)勢(shì)和電力系統(tǒng)的應(yīng)用需求,發(fā)揮電力大數(shù)據(jù)的價(jià)值,將為智能電網(wǎng)的建設(shè)帶來(lái)新的發(fā)展契機(jī)。

  電力企業(yè)應(yīng)該牢牢抓住這個(gè)契機(jī),從數(shù)據(jù)政策、人才培養(yǎng)、關(guān)鍵技術(shù)研發(fā)等層面,全面促成電力大數(shù)據(jù)技術(shù)的發(fā)展。

保定市四北電子有限公司具有卓越的產(chǎn)品性能、優(yōu)良的品質(zhì)、高可靠的電源設(shè)計(jì),并提供定制開(kāi)關(guān)電源服務(wù)。現(xiàn)已形成幾大系列產(chǎn)品:開(kāi)關(guān)電源系列、逆變電源系列、充電電源系列、備用電源系列等產(chǎn)品。提供AC/DC、DC/DC、DC/AC基板式、模塊式、嵌入式等各種形式專(zhuān)用電源。
主要電源類(lèi)別有:電力自動(dòng)化設(shè)備專(zhuān)用電源;通訊領(lǐng)域?qū)S秒娫;電力測(cè)試儀器專(zhuān)用電源;機(jī)車(chē)控制系統(tǒng)電源:高壓激光電源;浮充電電源;UPS電源;伺服式交流穩(wěn)壓電源;ZDD系列20W∽3KW逆變電源。http://m.zengchan.cn

【上一個(gè)】 開(kāi)關(guān)電源廠家簡(jiǎn)說(shuō)逆變器對(duì)于提升電網(wǎng)品質(zhì)的幫助 【下一個(gè)】 四北電子公司介紹如何設(shè)計(jì)高效小型化開(kāi)關(guān)電源


 ^ 開(kāi)關(guān)電源廠家口若懸河講面向智能電網(wǎng)應(yīng)用的電力大數(shù)據(jù)關(guān)鍵技術(shù)