Днес Microsoft направи важни съобщения относно генеративните функции за безопасност на AI. Сред тях е въведен нов инструмент в рамките на Azure AI Content Safety framework, насочен към откриване и коригиране на халюцинирано съдържание, генерирано от AI. Освен това Microsoft разкри, че нейната услуга Azure OpenAI ще започне да прилага невидими водни знаци в изображения, генерирани чрез модела DALL-E 3.
Освен това Microsoft продължава да се фокусира върху безопасността на AI с публичния преглед на своя иновативен мултимодален API в рамките на услугата Azure AI Content Safety. Този API е проектиран да идентифицира вредно или неподходящо съдържание, независимо дали произхожда от създатели хора или инструменти с изкуствен интелект.
Според публикация в блог на Microsoft:
Мултимодалният API включва въвеждане както на текст, така и на изображение. Той е проектиран за откриване на много класове и много сериозност, което му позволява да класифицира съдържание в различни категории и да присвои оценка за сериозност на всяка. За всяка категория системата предоставя ниво на сериозност, вариращо от 0, 2, 4 до 6. По-голямото число означава по-голяма сериозност на съдържанието.
Този наскоро стартиран мултимодален API може да идентифицира вредно съдържание както в текст, така и в изображения, включително емотикони, които може да съдържат опасни или неподходящи теми. Това включва изрично съдържание, реч на омразата, насилие, самонараняване и сексуално съдържание. Microsoft подчертава, че API може да открие такова съдържание, дори когато се появява в комбинация от текст и изображения, което иначе може да бъде доброкачествено, когато се анализира индивидуално.
В своето изявление Microsoft подчерта:
Чрез постигането на тези цели функцията за мултимодално откриване насърчава по-безопасно и по-уважително потребителско изживяване, което позволява креативно, но отговорно генериране на съдържание.
Освен това Microsoft отбеляза, че новият Multimodal API е в състояние бързо да открива вредно съдържание, като гарантира, че то не се разпространява до потребители на различни приложения или услуги.