Rudi kwenye makala zote

Vidokezo 7 vya Picha Vinavyoongeza Mara Mbili Usahihi wa Kuhesabu kwa AI

Tofauti kati ya hesabu ya 78% na hesabu ya 98% kwa kawaida si AI. Ni picha. Vidokezo hivi 7 vya vitendo vinasuluhisha makosa ya kawaida zaidi.

list Katika makala hii

Tofauti kati ya hesabu ya 78% na hesabu ya 98% kwa kawaida si AI - ni picha.

Zana za kuhesabu za AI zinachakata haswa unachozipa. Picha kali, yenye mwanga mzuri na vitu vilivyotenganishwa wazi inarudisha hesabu karibu kamili. Picha iliyofifia, yenye vivuli na vitu vilivyoingiliana inarudisha makadirio. Utafiti kutoka kipimo cha SNAP unathibitisha kuwa hali za upigaji picha - mwangaza, mfiduo, na pembe ya kamera - zinaathiri sana utendaji wa modeli ya kujifunza kwa kina, wakati mwingine zaidi ya muundo wa modeli yenyewe. Habari njema: kurekebisha picha zako ni bure, haraka, na yenye ufanisi mkubwa.

1. Tandaza vitu katika tabaka moja

Kuingiliana ni sababu ya kwanza ya kuhesabu pungufu. Skrubu mbili zinapokaa juu ya nyingine, kamera inaona umbo moja. AI haiwezi kuhesabu kitu isichokiona.

Kabla ya kupiga picha, chukua sekunde 10 kutandaza vitu katika tabaka moja, tambarare. Sogeza vipande mbali hadi uweze kuona kipande cha mandhari kati ya kila kimoja. Hii peke yake inaweza kuboresha usahihi kwa pointi 10 hadi 15 za asilimia kwenye mandhari zenye msongamano.

Jaribio la haraka

Ukiweza kuona kila kitu kimoja kutoka juu, AI pia inaweza. Vitu viwili vikionekana kama umbo moja, AI itavihesabu kama kimoja.

2. Piga picha kutoka juu moja kwa moja

Upotoshaji wa mtazamo ni wa hila. Unapopiga picha ya trei ya skrubu kwa pembe ya digrii 45, skrubu za nyuma zinaonekana ndogo na karibu zaidi kuliko zile za mbele. Modeli ya AI inachakata ukubwa wa pikseli, kwa hivyo vitu vinavyoonekana vidogo vinatambuliwa kwa uaminifu mdogo.

Shika simu yako au kamera sambamba na uso, ukielekeza chini moja kwa moja. Simu nyingi za kisasa zina chaguo la gridi kwenye mipangilio ya kamera - washa na uweke kando za uso sawa na mistari ya gridi. Picha kamili kutoka juu inapa kila kitu ukubwa sawa wa pikseli na kuondoa kufichwa na kina.

Simu ya mkononi ikishikwa juu moja kwa moja ya trei ya vipengele vidogo vya vifaa, ikionyesha pembe bora ya juu kwa uhesabuji wa vitu wa AI

3. Tumia mandhari yenye utofautishaji

Utambuzi wa vitu unafanya kazi kwa kupata kingo - mipaka ambapo rangi moja inakutana na nyingine. Vitu vyako vinapochanganyika na mandhari, kingo hizo zinatoweka.

Suluhisho ni rahisi: tumia kinyume chake. Vitu vyeusi vinawekwa kwenye uso mwepesi. Vitu vyepesi vinawekwa kwenye uso mweusi. Karatasi nyeupe kwa skrubu nyeusi, kitambaa cheusi kwa ringa za fedha. Epuka mandhari ya kijani, ambayo yanaweza kusababisha kutawanyika kwa rangi kunakochangusha AI kwenye mipaka ya vitu. Kadri utofautishaji unavyokuwa mkali, ndivyo utambuzi unavyokuwa safi.

4. Tumia mwangaza sawa, uliotawanywa

Mwangaza mkali wa mwelekeo mmoja unasababisha matatizo mawili: sehemu zenye mng'aro zinazofuta maelezo na vivuli vyeusi vinavyoficha vitu kabisa. Kivuli kinachoanguka kwenye safu ya tembe kinaweza kugawanya kitu kimoja kuwa maumbo mawili yaliyotambuliwa, au kufanya kitu kitoweke.

Mwangaza bora kwa picha za kuhesabu ni laini na sawa. Karibu na dirisha katika siku ya mawingu ni bora. Ndani ya nyumba, paneli za fluorescent au LED za juu zinafanya kazi vizuri. Ukiwa na taa ya meza tu, ielekeze kwenye ukuta au dari nyeupe badala ya kuielekeza moja kwa moja kwenye vitu. Lengo ni mwangaza sawa bila vivuli vinavyoonekana kati ya vitu.

Picha mbili za kando kwa kando za vitu hivyo hivyo, moja yenye vivuli vikali kutoka mwangaza wa moja kwa moja na nyingine yenye mwangaza sawa uliotawanywa ikionyesha jinsi mwangaza unavyoathiri mwonekano

5. Hesabu kwa makundi kwa idadi kubwa

Kujaribu kuweka vitu 500 kwenye picha moja kunamaanisha kila kitu kinachukua pikseli chache sana. Vitu chini ya takriban pikseli 20 vinakuwa vigumu kwa AI kutofautisha na kelele au muundo wa mandhari. Kadri kila kitu kinavyoonekana kidogo, ndivyo modeli inavyoshindwa zaidi.

Kwa idadi zaidi ya 100, gawanya katika makundi ya 50 hadi 100 kwa picha. Hesabu kila kundi tofauti na jumlisha jumla. Hii inaweka kila kitu kuwa kikubwa vya kutosha kwa utambuzi wa kuaminika na kupunguza athari ya mrundikano ya makosa madogo kwa kila kitu. Picha tano za vitu 100 kila moja zitatoa jumla sahihi zaidi kuliko picha moja ya 500.

6. Acha flash

Flash ya simu yako inawaka kutoka chanzo cha nukta karibu na lenzi. Hii inaunda sehemu ya mng'aro katikati na vivuli vikali kwenye kingo - haswa hali za mwangaza zinazodumaza usahihi wa utambuzi.

Flash pia inaunda mwonekano wa kuakisi kwenye nyuso zenye kung'aa au za chuma, ikibadilisha kichwa cha skrubu kuwa pande nyeupe ambayo AI haiwezi kuainisha. Zima flash na tegemea mwangaza wa asili. Ikiwa eneo ni giza sana, ongeza chanzo cha mwangaza tofauti kilichowekwa juu na kidogo kando, au hamia eneo lenye mwanga zaidi.

7. Hakikisha fokasi kali

Picha iliyofifia inafuta kingo kati ya vitu, ambayo haswa ni taarifa inayohitajika na AI kutambua mipaka. Hata ufifu mdogo wa mwendo kutoka mkono unaotetemeka unaweza kupunguza usahihi kwa vitu vidogo.

Gusa skrini ili kufunga fokasi kwenye vitu kabla ya kupiga. Shika simu yako imara, au itegemeze kwenye uso. Kwa hesabu muhimu, tumia kipima muda cha sekunde 2 kuondoa mtetemo wa kubonyeza kitufe cha shutter. Ubora wa pikseli 2,000 au zaidi kwenye upande mrefu zaidi unahakikisha AI ina maelezo ya kutosha kufanya kazi, ingawa hata pikseli 1,000 zinatumika kwa vitu vikubwa.

Linganisho la karibu likionyesha picha kali na fifia za vipengele vidogo vya chuma, ikionyesha jinsi ubora wa fokasi unavyoathiri utambuzi wa vitu

Kuweka yote pamoja

  • Tandaza vitu katika tabaka moja na nafasi zinazoonekana
  • Shika kamera juu moja kwa moja
  • Weka vitu kwenye mandhari yenye utofautishaji
  • Tumia mwangaza laini, sawa bila vivuli vikali
  • Gawanya idadi kubwa katika makundi ya 50 hadi 100
  • Zima flash
  • Gusa ili kufokasi na shika imara

Hakuna kidokezo hata kimoja kinachohitaji vifaa maalum. Simu ya mkononi, karatasi, na dirisha vinatosha. Athari ya pamoja ni kubwa: watumiaji wanaofuata miongozo hii kwa uthabiti wanaripoti usahihi zaidi ya 95%, ikilinganishwa na 75 hadi 85% na picha za kawaida zisizodhibitiwa.

Wakati mwingine unapohitaji kuhesabu vitu kutoka picha, tumia sekunde 30 kuandaa picha. Uwekezaji huo wa nusu dakika unakuokoa kutoka kuhesabu tena, kutilia shaka, na kuamini nambari ambayo inaweza kuwa mbali kwa 20%. AI iko tayari. Ipe picha inayostahili kuhesabiwa.