發表文章

Walking on Kendall’s Shape Space: Understanding Shape Spaces and Their Coordinate Systems - Tangent Space

  由於Kendall的形狀空間是一個非線性空間,在其中進行計算相當麻煩。因此,大多數關於形狀變異的研究通常只使用這個非線性空間的局部近似——一個平坦的、線性的切線空間。 形狀切線空間的維度與它所近似的形狀空間的維度相同。在三角形的情況下,因此每個切線空間都是二維的,也就是一個平面。 切線空間可以提供形狀空間有限區域的近似線性表示,但如果有相對較大範圍的不同形狀,不可避免會產生扭曲。由於相同的效應,世界地圖通常會顯示格陵蘭和南極洲的形狀嚴重扭曲,因為地圖投影通常是針對赤道優化的,對高緯度地區造成了扭曲。 樣本中的平均形狀通常是切線點的不錯選擇,因為它通常位於分佈的中心附近,因此在所有方向上的扭曲都相對較小,而且樣本中沒有觀測值會遭受不成比例的扭曲。需要注意的是,切線投影還會導致重心大小略微增加,這取決於形狀與切線點的形狀差異的大小(在圖5中,點F'和P'比F和P分別稍遠離點O)。

Walking on Kendall’s Shape Space: Understanding Shape Spaces and Their Coordinate Systems - Kendall’s Shape Space

圖片
  要想了解特定數量地標的所有可能形狀,我們可以建立一個所謂的形狀空間。在這個空間裡,每個點都代表一種特定的形狀,點之間的距離則表示這些形狀之間的差異大小。不管我們用的是部分還是完整Procrustes距離來衡量,結果都是一個彎曲的多維空間,所以形狀空間相當複雜。 線性空間 vs 非線性空間 線性空間(比如歐幾里得空間)中,維度對應於 1) 我們需要多少坐標才能確定空間中的一個點,或者 2) 點在空間中可以朝多少個垂直方向移動。 非線性空間 比如說圓形,這可能是最簡單的非線性空間,我們來問問它有幾個維度。一開始可能會認為,因為圓形嵌入在平面中,有x和y坐標,看起來像是有兩個維度。但實際上,x和y坐標之間有很強的關聯性(距離中心的平方偏差總是加起來等於圓的半徑平方),而且圓上的每一點只能沿著一個方向滑動(沿著圓周,而不是徑向)。而且,只需要給出一個角度,就足以確定圓上一點的位置(比如說,3點鐘的位置)。所以,從這個角度看,圓實際上只有一個維度。同樣地,球面有兩個維度(只需要經度和緯度就能確定地球上的一個點)。 三角形的形狀空間 在這種情況下,形狀空間是二維的:有三個地標,每個地標有兩個坐標,但我們需要減去四個維度,因為標準化大小、位置和方向會失去這些自由度,所以最後剩下兩個維度。 假設有一大批各種形狀的三角形, 使用普氏叠加(Procrustes superimposition)去除非形狀幾何特徵後,我們能夠計算出不同三角形形狀間的成對距離 (pairwise distance),並將這些距離 ( 普氏距離) 記錄在一個表格中。 接著可以用 主坐標分析(principal coordinate analysis)或等效的度量多維擴展(metric multidimensional scaling),可以把所有可能形狀 (每一個點代表一個形狀) 投影到 半徑為0.5的球面上, 這個球面就是所謂的肯德爾形狀空間(Kendall's shape space)。 補充:主座標分析的缺點 (看不懂XD) 專有名詞 主座標分析 ( principal coordinate analysis)

Walking on Kendall’s Shape Space: Understanding Shape Spaces and Their Coordinate Systems - Procrustes Distance

圖片
 Procrustes Distance 衡量 地標配置之間形狀差異,最直觀的方法就是計算它們重合後對應地標之間距離的平方和。但對應地標之間距離平方和本身不直接表示距離,要再取平方根,這個度量被稱為 Procrustes距離。 完整Procrustes距離(dF)vs 部分Procrustes距離(dP) 不完全相同的形狀,完整Procrustes距離肯定比部分Procrustes距離小。 但對於生物數據來說,這種差異通常很小。理論最大值, 完整Procrustes距離可以達到1.0,而部分Procrustes距離可以達到2的平方根,大約是1.41。 黎曼距離 如果以三角形來看,標準化後的三角形三頂點會在一個半徑為1的圓上,因此,頂點間的距離也可以用圓弧的角度來表示。這個距離被稱為黎曼距離,最大可達 π/2,約為1.57。 1. 將一個形狀(P)進行部分Procrustes重合到目標(T),兩組地標配置都縮放到重心大小           1.0,這意味著這兩點都距離坐標系原點(O)為1.0 2. 部分Procrustes距離和黎曼距離ϱ之間的關係可以通過兩個直角三角形O-T-M和O-P-M建                立 ,其中M是P和T之間的中點。 3. 這兩個三角形頂點O處的角度為ϱ/2。 4. 因為O與P和T的距離都為1.0,所以T-M和P-M的距離都是sin(ϱ/2),所以, P和T之間的部分Procrustes距離為2sin(ϱ/2)。 至於 完整Procrustes重合,形狀縮放使得從形狀進行擬合到目標的線(F-T)與到原點的線(F-O)成直角。考慮直角三角形O-F-T,可以得出完整Procrustes距離是sin(ϱ)。

Walking on Kendall’s Shape Space: Understanding Shape Spaces and Their Coordinate Systems - Procrustes Superimposition

  這個方法的核心就是通過改變一組地標配置的非形狀特徵(比如大小、位置和方向),讓它盡可能地適應另一組。有三個步驟: Scaling 縮放 把兩組配置縮放到同一個大小 (size),把所有配置的大小都縮放到單位重心大小,這樣比較的地標配置之間就沒有大小之差了。 Size 大小 通常是質心大小 (Centroid size) , 也就是每個地標到所有地標重心的距離平方和的平方根。 Transition 平移 把每個地標配置的重心座標重疊起來。實際操作上可以把每個地標的座標減去重心座標。 Rotation 旋轉 讓一系列地標盡可能地靠近。 以上的過程消除地標配置之間的非形狀變異,這個過程稱為Procrustes Superimposition。 Procrustes Superimposition又可以分成完整跟部分兩種形式,差別只在縮放時是否縮放到相同大小: Full Procrustes superimposition:即符合上面所說,把每個地標配置的質心大小縮放到相同大小。 Partial Procrustes superimposition:為了讓最後每一個系列地標的平方距離能越接近越好,在縮放的部分稍微調正,而不追求質心大小要完全一樣。 專有名詞 地標配置 (landmark configuration) 質心座標:所有地標座標的算術平均數

Walking on Kendall’s Shape Space: Understanding Shape Spaces and Their Coordinate Systems - Shape Distances and Shape Spaces

 Shape Distances and Shape Spaces 形狀距離與形狀空間 什麼是形狀? 形狀的定義是大小(size)、位置(position)和方向(orientation)以外的所有幾合特徵,包括難以量化的比例、角度和部件的相對位置等。 形狀距離和形狀空間必須只包含屬於形狀的那些方面。如果兩個配置僅在大小、位置和方向上有差異,它們的形狀距離應該是零,因為它們的形狀是相同的。所以,在形狀空間中,這兩個配置會落在同一點上。 形狀空間的維度? 一般來說,空間的維度取決於一個形狀能被多少參數調整。 如果是2D的數據,每個地標有兩個座標(x, y),所以k個地標會有2k個座標變數可以調。但是形狀的參數還要扣掉大小、位置跟方向的參數,其中大小有一個、位置有兩個、旋轉有一個,也就是說維度會是2k-4維。 如果是3D的數據,每個地標會有三個座標 (x, y, z) ,所以k個地標會有3k個座標變數可以調。同樣也要扣掉大小變數一個、位置三個、旋轉三個,等於3k-7。 形狀距離 理論上可以定義很多不同的形狀距離,從而產生不同的形狀空間, 但在實際應用中,最常用的是基於Procrustes superimposition的Procrustes距離。 Procrustes superimposition 專門用來區分地標配置中形狀與非形狀的變異部分。 專有名詞: Procrustes superimposition shape

Walking on Kendall’s Shape Space: Understanding Shape Spaces and Their Coordinate Systems - Introduction

形態測量學和形狀統計學的發展中,越來越強調要精確地描述那些用來分析形狀的多維空間,但形狀空間雖然能以數學方式嚴謹的定義,卻難以直觀的理解。 所謂的形狀空間是一個抽象概念,在這個空間中的每一點都代表一個特定形狀,一個特定類型的形狀的各種形狀*,在一個特定的形狀空間找到代表它的點,這個空間的整體結構反映了這些形狀所有可能的變化範圍。這些點之間的距離,就代表了它們形狀上的差異大小。 有一些人嘗試用視覺化的方式使人理解這些概念,例如Kendall的形狀空間 (Kendall's shape space) 是一個球面,可以解釋三角形的形狀空間。 使用座標系統也可以幫助理解形狀空間,怎麼把真實的地標座標擬合到形狀空間中是一個理解的角度。 本文的目標是透過大量使用圖形視覺化來讓大家對Kendall的三角形形狀空間有更直觀的理解。通過明確指出地標數據坐標系統中形狀和非形狀的部分,也可以清楚地理解Procrustes重合和形狀切線空間如何與地標坐標相關。雖然文章主要集中在二維中三角形的形狀分析上,但我們也會探討從三角形中獲得的見解如何適用於更複雜的地標配置。 *聽起來很敖口,但意思就是像 由12個地標構成的形狀的各種變形 專有名詞 Kendall's shape space Procrustes superimposition shape space