Home 知識 圖像識別(CV)在房地產領...

圖像識別(CV)在房地產領域的應用



過去兩年,我們 Trulia Data Science Team 探索了大量圖像識別(Computer Vision)在房地產相關的應用,在 Trulia 上線了一些,併發布了一些博客, 在這裡一併總結一下。

相關博客:

背景

Trulia 上展示著大量的房地產相關圖片,每天的新照片數量超過百萬,單從數量上來說,可能是圖片數量最大的產品之一。 在這個注重視覺體驗的時代,如果想要給使用者更好的體驗,將圖片作為中心打造產品,我們必須瞭解每一張圖片。 因此,我們組一直在探索相關的技術,開發新的應用。

Scene Classification

我們首先完成研發的是圖像的分類。 在一般的房屋圖片中,都有不同的房間類型,比如廚房、客廳、臥室、後院等等。 我們訓練了深度模型可以準確地將圖片歸類成為幾十種房間類型。

一旦有了房間類型,我們可以圍繞著這些圖像資料做一些視覺體驗優先的特性,比如專門把好看的游泳池放在一塊一起展示,這樣給使用者帶來了更好的流覽體驗。 使用者開心了,自然就會在網站上停留更久。

Image Appropriateness and Quality

當網站上的內容過多,都會出現一些極端情況,比如不符合規範的內容。 在圖片中也有這樣的情況,不少上傳的圖片並不是房地產領域的圖片,比如寵物、大量文字等等。 為了解決這個問題,我們開發了模型來預測圖片是否適合房地產領域。

同時,我們也非常在乎對於不同的圖片,哪一張更好看。 為此,我們開發了模型來預測圖片的好看程度。

這些模型被應用在了不同的領域,確保使用者能夠看到好看的圖片,遠離不相關的圖片,增加使用者體驗。

Hero Image

一個房子平均有20張圖片,但幾乎所有展示房子的地方都只會放一張圖片。 放哪一張圖片最合適? 我們使用演算法,結合通過模型預測的圖片的幾個資訊,來自動挑選封面照片。

我們的演算法結合了模型預測出來的分數,去掉不適合房地產領域的圖片,參考圖片好看程度,並給與不同的房間類型不同的權重,綜合選出最好的照片作為封面照片。 這樣的演算法還可以根據使用者偏好的房間類型,比如廚房、臥室,來給使用者優先展示使用者喜歡看到的圖片,做到個人化的圖片推薦。

What is Next?

隨著視覺體驗的重要性日益增加,使用者越來越期待看到圖片,而不是文字的內容。 因此,把圖片作為產品的核心,是一個無法阻擋的趨勢。 而只有讓電腦理解圖片,才能給使用者相關的內容。 為了像理解文字那樣理解圖片,必須要研發相關的技術,做好技術儲備。

正如我在答案如何評價谷歌的「人工智慧先行」(AI First)戰略? 中所說,現在是做機器學習應用最好的時代。 越來越多成熟的框架和資料集的出現,大大減低了研發的難度,應用的研發已經沒有技術門檻。 我們應該更多地探索使用者的需求與體驗,思考如何使用技術帶來全新的產品,更好地服務使用者。

—-

@陳然

來源:知乎 www.zhihu.com

作者:陳然

【知乎日報】 千萬使用者的選擇,做朋友圈裡的新鮮事分享大牛。
點擊下載



文章來源