應(yīng)用

技術(shù)

物聯(lián)網(wǎng)世界 >> 物聯(lián)網(wǎng)新聞 >> 物聯(lián)網(wǎng)熱點(diǎn)新聞
企業(yè)注冊(cè)個(gè)人注冊(cè)登錄

賽題解讀 | 城市治理之垃圾暴露檢測(cè)算法賽

2023-03-15 08:56 貴陽(yáng)大數(shù)據(jù)交易所

導(dǎo)讀:“數(shù)據(jù)場(chǎng)景應(yīng)用創(chuàng)新大賽”正如火如荼地舉辦中,大賽致力于探究數(shù)據(jù)要素流通交易的應(yīng)用場(chǎng)景和解決方案,助推數(shù)字經(jīng)濟(jì)發(fā)展,助力數(shù)字強(qiáng)國(guó)建設(shè) 。

數(shù)字經(jīng)濟(jì)方興未艾,正深入滲透到社會(huì)各領(lǐng)域全過(guò)程。由國(guó)家信息中心、貴州省大數(shù)據(jù)發(fā)展管理局、貴州省氣象局、共青團(tuán)貴州省委、貴陽(yáng)市人民政府指導(dǎo),貴陽(yáng)大數(shù)據(jù)交易所主辦的“數(shù)據(jù)場(chǎng)景應(yīng)用創(chuàng)新大賽”正如火如荼地舉辦中,大賽致力于探究數(shù)據(jù)要素流通交易的應(yīng)用場(chǎng)景和解決方案,助推數(shù)字經(jīng)濟(jì)發(fā)展,助力數(shù)字強(qiáng)國(guó)建設(shè) 。

近日,由貴陽(yáng)大數(shù)據(jù)交易所主辦、北京易華錄信息技術(shù)股份有限公司(以下簡(jiǎn)稱(chēng)“易華錄”)協(xié)辦的“數(shù)據(jù)場(chǎng)景應(yīng)用創(chuàng)新大賽”—圖片賽道“城市治理之垃圾暴露檢測(cè)算法賽”解讀及答疑活動(dòng)在線上成功舉辦。易華錄數(shù)據(jù)要素事業(yè)群技術(shù)副總經(jīng)理魏健康對(duì)賽題進(jìn)行了詳細(xì)解讀,并圍繞參賽選手及團(tuán)隊(duì)提出的問(wèn)題進(jìn)行了答疑解惑。

-賽題解讀-

探索城市治理,創(chuàng)新場(chǎng)景應(yīng)用解決方案

城市治理已成為推進(jìn)國(guó)家治理體系和治理能力現(xiàn)代化的重要內(nèi)容。習(xí)近平總書(shū)記強(qiáng)調(diào),“推進(jìn)國(guó)家治理體系和治理能力現(xiàn)代化,必須抓好城市治理體系和治理能力現(xiàn)代化”“要著力完善城市治理體系和城鄉(xiāng)基層治理體系,樹(shù)立‘全周期管理’意識(shí),努力探索超大城市現(xiàn)代化治理新路子”。

隨著人們生活質(zhì)量的提高,很多污染嚴(yán)重的殘剩物被隨意地丟棄,不僅影響市容,還給居民的生活帶來(lái)極大困擾,為了達(dá)到利用人工智能技術(shù)進(jìn)行垃圾暴露現(xiàn)象事件抓拍、證據(jù)留存的目的,本次圖片賽道以“針對(duì)城市道路和社區(qū)環(huán)境中的垃圾暴露現(xiàn)象進(jìn)行感知發(fā)現(xiàn)”為主題。賽道要求參賽選手根據(jù)提供的檢測(cè)數(shù)據(jù)集,進(jìn)行模型設(shè)計(jì)和優(yōu)化。

本賽題中,垃圾按照數(shù)據(jù)集目標(biāo)數(shù)量和類(lèi)別被分為十類(lèi),每一類(lèi)垃圾圖片數(shù)量為幾十至幾千張。根據(jù)不同尺寸和形狀的目標(biāo),數(shù)據(jù)集提供的原始圖片分辨率也不同,分辨率像素區(qū)間為300—2048ppi,需要選手分析標(biāo)簽物體分辨率的分布范圍,考慮模型的輸入尺寸。

選手需對(duì)數(shù)據(jù)集進(jìn)行去重和清洗,確保數(shù)據(jù)集中沒(méi)有重復(fù)樣本和錯(cuò)誤標(biāo)注信息。在數(shù)據(jù)預(yù)處理上,選手需對(duì)數(shù)據(jù)集進(jìn)行預(yù)處理,包括對(duì)圖片進(jìn)行縮放、裁剪、歸一化等,以及對(duì)標(biāo)注信息進(jìn)行格式轉(zhuǎn)換和統(tǒng)一格式等操作,以便后續(xù)的訓(xùn)練和評(píng)估。在數(shù)據(jù)增強(qiáng)上,選手需對(duì)數(shù)據(jù)集進(jìn)行增強(qiáng),擴(kuò)充、以增加數(shù)據(jù)集的多樣性和豐富性,提高模型的泛化能力,在進(jìn)行數(shù)據(jù)擴(kuò)充時(shí),需要保證擴(kuò)充后的數(shù)據(jù)仍然具有一定的真實(shí)性和合理性。

在模型選擇上,選手可選取基于Anchor-Based的RetinaNet,通過(guò)引入Focal Loss來(lái)解決類(lèi)別不平衡問(wèn)題,提高小目標(biāo)檢測(cè)的性能。CenterNet通過(guò)直接預(yù)測(cè)目標(biāo)中心點(diǎn)和寬高,避免Anchor的生成和匹配過(guò)程,可極大簡(jiǎn)化模型架構(gòu);或基于Anchor-Free的yolo系列DETR—一種完全去除Anchor的目標(biāo)檢測(cè)模型,通過(guò)Transformer機(jī)制直接將目標(biāo)檢測(cè)轉(zhuǎn)換為對(duì)象集合預(yù)測(cè)問(wèn)題。FCN雖然被廣泛應(yīng)用于語(yǔ)義分割任務(wù),也可適用于本賽題目標(biāo)檢測(cè)任務(wù),通過(guò)在特征圖上進(jìn)行滑動(dòng)窗口來(lái)實(shí)現(xiàn)目標(biāo)檢測(cè)。此外,選手還可以自由選擇其他模型。

在Pipeline搭建上,選手可采用mmcv框架對(duì)相應(yīng)的訓(xùn)練機(jī)制進(jìn)行處理,在時(shí)間允許的條件下,可自行設(shè)計(jì)分類(lèi)模型進(jìn)行輔助;也可以將檢測(cè)和分類(lèi)結(jié)構(gòu)融合到一個(gè)網(wǎng)絡(luò)里,在特征提取之后進(jìn)行雙任務(wù)推理,最終將推理結(jié)果進(jìn)行融合分析。此外,選手需注意最后提交的結(jié)果格式。

落實(shí)大賽保障,開(kāi)拓大數(shù)據(jù)人才培養(yǎng)模式

一直以來(lái),易華錄圍繞“收、存、治、用、易”主航道,開(kāi)拓大數(shù)據(jù)人才培養(yǎng)多元模式,深入探索技能大賽人才培養(yǎng)方向,為國(guó)賽、省賽及專(zhuān)業(yè)領(lǐng)域賽事領(lǐng)域做出積極貢獻(xiàn)。基于賽事的寶貴經(jīng)驗(yàn),針對(duì)大賽圖片賽道“城市治理之垃圾暴露檢測(cè)算法賽”賽題設(shè)置,易華錄希望選手能夠?qū)⒓夹g(shù)引入應(yīng)用,切實(shí)解決一些基層治理難題,實(shí)現(xiàn)城市治理數(shù)字化轉(zhuǎn)型。作為大賽的協(xié)辦單位,易華錄提供了城市道路和社區(qū)環(huán)境等生活場(chǎng)景圖片、垃圾暴露標(biāo)注圖片等賽題數(shù)據(jù),并對(duì)圖片中常見(jiàn)的垃圾暴露現(xiàn)象進(jìn)行了標(biāo)注,垃圾類(lèi)別包含紙屑垃圾、打包垃圾、蛇皮袋垃圾等10類(lèi)。賽題要求選手建立合理模型,以達(dá)到城市垃圾自動(dòng)識(shí)別水平。

“作為本次大賽賽事的協(xié)辦單位,易華錄在貢獻(xiàn)技術(shù)力量的同時(shí),深度參與到大賽的運(yùn)營(yíng)當(dāng)中,通過(guò)設(shè)立專(zhuān)業(yè)運(yùn)營(yíng)團(tuán)隊(duì),確?!畷r(shí)間、人員、責(zé)任’三落實(shí);同時(shí),作為社會(huì)可信的數(shù)據(jù)資產(chǎn)化提供商,易華錄由衷地期望能夠以本次大賽為契機(jī),與貴陽(yáng)大數(shù)據(jù)交易所一同搭建數(shù)據(jù)市場(chǎng)供需方的橋梁,充分釋放數(shù)據(jù)價(jià)值,真正為實(shí)際應(yīng)用場(chǎng)景提供數(shù)據(jù)賦能?!蔽航】当硎?,“我們希望選手能夠?qū)⒓夹g(shù)引入應(yīng)用,切實(shí)地解決基層治理的一些難題,實(shí)現(xiàn)城市治理的數(shù)字化轉(zhuǎn)型?!?/p>

當(dāng)下,信息技術(shù)的快速發(fā)展推動(dòng)生產(chǎn)方式、生活方式和治理方式的深刻變革,城市建設(shè)和社會(huì)發(fā)展之間的相互影響日益增強(qiáng),智能建造和新型智慧城市正推動(dòng)城市規(guī)劃建設(shè)領(lǐng)域轉(zhuǎn)型升級(jí),推動(dòng)新型城市建設(shè)已成為時(shí)不我待的重要命題。大賽聚焦前沿信息技術(shù)在城市規(guī)劃建設(shè)領(lǐng)域中的創(chuàng)新應(yīng)用成果落地,期待各位參賽選手的精彩角逐,希望選手能夠享受比賽,賽出水平、賽出風(fēng)格、賽出成績(jī)。

-答疑環(huán)節(jié)-

  Q:請(qǐng)問(wèn)最終成績(jī)以什么為準(zhǔn)?多少名可以進(jìn)入決賽?

以3月20日打榜的最終結(jié)果為準(zhǔn),每天有2次打榜的機(jī)會(huì),各位參賽選手在打榜時(shí)間之前提交作品,最終有20支隊(duì)伍可以進(jìn)入決賽,如組委會(huì)在審核作品過(guò)程中發(fā)現(xiàn)問(wèn)題,比如作弊或者抄襲等,名次將往下順延。

Q:標(biāo)注框坐標(biāo)數(shù)值要用float嗎?

坐標(biāo)值一般是用float,但是也可以用int,評(píng)分系統(tǒng)對(duì)這個(gè)沒(méi)有要求。

 Q:訓(xùn)練集里有部分場(chǎng)景,標(biāo)注規(guī)范不一致,參賽選手在識(shí)別的時(shí)候,有些carton堆疊在一起,有的是逐個(gè)標(biāo)注的,每個(gè)carton一個(gè)獨(dú)立的標(biāo)注框。請(qǐng)問(wèn)在我們識(shí)別的時(shí)候,是把堆疊的物體識(shí)別成一個(gè),還是單獨(dú)標(biāo)注一個(gè)框?

建議按照大的標(biāo)注框進(jìn)行召回。但是要考慮數(shù)量的多少,在數(shù)量很多的情況下,可以按照大標(biāo)注框召回,如果數(shù)量很少,可以加判斷的標(biāo)準(zhǔn),需要實(shí)際地去操作。

Q:訓(xùn)練時(shí)發(fā)現(xiàn)了數(shù)據(jù)中有標(biāo)注錯(cuò)誤的圖片怎么辦?

圖片難免會(huì)出現(xiàn)標(biāo)注錯(cuò)誤的現(xiàn)象,占比很少,可以視為噪聲或者是干擾數(shù)據(jù),也相當(dāng)于一定程度上增加了比賽難度,選手可以充分發(fā)揮自身能力,找到合適的數(shù)據(jù)處理方法,或者選擇一些合適的模型,從而達(dá)到比較精準(zhǔn)的預(yù)測(cè)結(jié)果。

Q:圖片數(shù)量是只有3806張嗎?

比賽共提供了7806張城市的各場(chǎng)景的圖片,其中4000張作為訓(xùn)練集,對(duì)圖片進(jìn)行了框選的標(biāo)注,并提供了XML格式的標(biāo)注文件,剩余的3806多張是作為測(cè)試級(jí)供選手去打榜。

Q:提交的文件里面圖片沒(méi)有目標(biāo),需要加一個(gè)空的字典嗎?

沒(méi)有強(qiáng)制要求,可以提交空的字典,也可以去掉圖片的ID。如果不足3806張,我們會(huì)對(duì)未提交的圖片作漏識(shí)別處理。

Q:打榜的時(shí)間是否可以改變?是否可以多次提交,按最高記錄保存?

目前打榜時(shí)間是早晨十點(diǎn),晚上八點(diǎn),每天兩次,打榜時(shí)間目前暫時(shí)不會(huì)進(jìn)行調(diào)整,同時(shí)打榜的成立是以最新的一次成績(jī)?yōu)樽罱K的結(jié)果,目的是讓選手去開(kāi)動(dòng)思維,不斷鍛煉自己的模型,希望各參賽選手能使用先進(jìn)的方法及創(chuàng)新的手段獲得一個(gè)更好、更高的評(píng)分。如果說(shuō)按最高成績(jī)作為最終結(jié)果,就會(huì)存在選手考慮到分夠高后不會(huì)再去優(yōu)化的情況。所以按照最后的一次成績(jī)作為最終的成績(jī),讓大家不斷地去訓(xùn)練自己的模型,提交更優(yōu)質(zhì)的作品,作為最終的結(jié)果。

Q:能實(shí)時(shí)評(píng)分嗎?

目前沒(méi)有實(shí)時(shí)評(píng)分,各位選手在提交的時(shí)候注意節(jié)點(diǎn)及最后打榜時(shí)間。

- 大賽詳情 -

1.jpg