Gustafsson skrev:Jag har lekt lite med ett par telefonappar, seek som känner igen växter man riktar kameran emot och Kvitteromat som känner igen fågelläten.
Medan Seek identifierar imponerande många växter korrekt, ser jag att min bil med FSD fortfarande inte ser skillnad på papperskorgar och långtradare. Den följer fel linjer i vägen under körning och tokvarnar för hinder som inte finns. Den ena kostar 70000, den andra är gratis. Vad gör dom på Tesla egentligen?
Det är skillnad på att hitta relevanta objekt och att identifiera ett objekt.
Ett problem är ju att "den riktiga världen", som Elon gillar att säga, innehåller så oändligt många saker.
Ett trivialt exempel: Det är ju skillnad på en bild på en stoppskylt eller ett trafikljus på en bussreklam eller tröja, och en verklig dito. FSD har ingen aning om det är en bild eller en verklig till exempel. Kartinformation med exakta positioner på riktiga trafikljus, skyltar osv skulle ju öka chansen att göra rätt. Med Lidar kan man lättare bedöma om det är ett riktigt objekt eller inte.
Den största skillnaden tycker jag är att ingen dör om en app på en telefon identifierar fel växt eller fågel... Har man en självkörande bil som susar omkring bland oskyddade trafikanter och gör fel så kan folk dö, även med en människa som fallback. Det är därför Cruise och Waymo har massor av lager av säkerhetssystem, geofence till förmappade områden osv. Det är det billigaste och enklaste sättet att nå upp i tillräckligt antal "nior" i säkerhet.
De allra flesta är överens att rena vision-only ML-system är inte redo för säkerhets-kritiska tillämpningar där man måste fatta beslut i realtid/snabbt. I framtiden kanske det går, men knappast inom de kommande 20 åren. Ibland tror jag inte folk förstår att man inte ens kan ersätta en person som kollar på röntgenplåtar på ett säkert vis, utan man behöver mänsklig granskning. Hur ska man då kunna köra bil autonomt bland fotgängare nästa år? Med kameror som har halva upplösningen av en OG iPhone från 2007