对于滥用技术术语表示赞赏。我正在通过卷积神经网络(CNN)进行语义分割的项目;试图实现Encoder-Decoder类型的体系结构,因此输出的大小与输入的大小相同。
您如何设计标签?一个应该应用什么损失函数?尤其是在严重的类别不平衡的情况下(但是类别之间的比率在图像之间是可变的)。
该问题涉及两个类别(感兴趣的对象和背景)。我正在将Keras与tensorflow后端一起使用。
到目前为止,我将应用按像素标注将预期输出设计为与输入图像相同的尺寸。模型的最后一层具有softmax激活(针对2个类)或S型激活(表示像素属于对象类的概率)。我在为此类任务设计合适的目标函数时遇到麻烦:
function(y_pred,y_true)
,
同意Keras的观点。
请尝试具体说明所涉及的张量的大小(模型的输入/输出)。任何想法和建议都非常感谢。谢谢 !