xref: /openbmc/linux/fs/overlayfs/dir.c (revision 51f7e52d)
1e9be9d5eSMiklos Szeredi /*
2e9be9d5eSMiklos Szeredi  *
3e9be9d5eSMiklos Szeredi  * Copyright (C) 2011 Novell Inc.
4e9be9d5eSMiklos Szeredi  *
5e9be9d5eSMiklos Szeredi  * This program is free software; you can redistribute it and/or modify it
6e9be9d5eSMiklos Szeredi  * under the terms of the GNU General Public License version 2 as published by
7e9be9d5eSMiklos Szeredi  * the Free Software Foundation.
8e9be9d5eSMiklos Szeredi  */
9e9be9d5eSMiklos Szeredi 
10e9be9d5eSMiklos Szeredi #include <linux/fs.h>
11e9be9d5eSMiklos Szeredi #include <linux/namei.h>
12e9be9d5eSMiklos Szeredi #include <linux/xattr.h>
13e9be9d5eSMiklos Szeredi #include <linux/security.h>
14e9be9d5eSMiklos Szeredi #include <linux/cred.h>
15e9be9d5eSMiklos Szeredi #include "overlayfs.h"
16e9be9d5eSMiklos Szeredi 
17e9be9d5eSMiklos Szeredi void ovl_cleanup(struct inode *wdir, struct dentry *wdentry)
18e9be9d5eSMiklos Szeredi {
19e9be9d5eSMiklos Szeredi 	int err;
20e9be9d5eSMiklos Szeredi 
21e9be9d5eSMiklos Szeredi 	dget(wdentry);
22e36cb0b8SDavid Howells 	if (d_is_dir(wdentry))
23e9be9d5eSMiklos Szeredi 		err = ovl_do_rmdir(wdir, wdentry);
24e9be9d5eSMiklos Szeredi 	else
25e9be9d5eSMiklos Szeredi 		err = ovl_do_unlink(wdir, wdentry);
26e9be9d5eSMiklos Szeredi 	dput(wdentry);
27e9be9d5eSMiklos Szeredi 
28e9be9d5eSMiklos Szeredi 	if (err) {
29e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: cleanup of '%pd2' failed (%i)\n",
30e9be9d5eSMiklos Szeredi 		       wdentry, err);
31e9be9d5eSMiklos Szeredi 	}
32e9be9d5eSMiklos Szeredi }
33e9be9d5eSMiklos Szeredi 
34e9be9d5eSMiklos Szeredi struct dentry *ovl_lookup_temp(struct dentry *workdir, struct dentry *dentry)
35e9be9d5eSMiklos Szeredi {
36e9be9d5eSMiklos Szeredi 	struct dentry *temp;
37e9be9d5eSMiklos Szeredi 	char name[20];
38e9be9d5eSMiklos Szeredi 
39e9be9d5eSMiklos Szeredi 	snprintf(name, sizeof(name), "#%lx", (unsigned long) dentry);
40e9be9d5eSMiklos Szeredi 
41e9be9d5eSMiklos Szeredi 	temp = lookup_one_len(name, workdir, strlen(name));
42e9be9d5eSMiklos Szeredi 	if (!IS_ERR(temp) && temp->d_inode) {
43e9be9d5eSMiklos Szeredi 		pr_err("overlayfs: workdir/%s already exists\n", name);
44e9be9d5eSMiklos Szeredi 		dput(temp);
45e9be9d5eSMiklos Szeredi 		temp = ERR_PTR(-EIO);
46e9be9d5eSMiklos Szeredi 	}
47e9be9d5eSMiklos Szeredi 
48e9be9d5eSMiklos Szeredi 	return temp;
49e9be9d5eSMiklos Szeredi }
50e9be9d5eSMiklos Szeredi 
51e9be9d5eSMiklos Szeredi /* caller holds i_mutex on workdir */
52e9be9d5eSMiklos Szeredi static struct dentry *ovl_whiteout(struct dentry *workdir,
53e9be9d5eSMiklos Szeredi 				   struct dentry *dentry)
54e9be9d5eSMiklos Szeredi {
55e9be9d5eSMiklos Szeredi 	int err;
56e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
57e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
58e9be9d5eSMiklos Szeredi 
59e9be9d5eSMiklos Szeredi 	whiteout = ovl_lookup_temp(workdir, dentry);
60e9be9d5eSMiklos Szeredi 	if (IS_ERR(whiteout))
61e9be9d5eSMiklos Szeredi 		return whiteout;
62e9be9d5eSMiklos Szeredi 
63e9be9d5eSMiklos Szeredi 	err = ovl_do_whiteout(wdir, whiteout);
64e9be9d5eSMiklos Szeredi 	if (err) {
65e9be9d5eSMiklos Szeredi 		dput(whiteout);
66e9be9d5eSMiklos Szeredi 		whiteout = ERR_PTR(err);
67e9be9d5eSMiklos Szeredi 	}
68e9be9d5eSMiklos Szeredi 
69e9be9d5eSMiklos Szeredi 	return whiteout;
70e9be9d5eSMiklos Szeredi }
71e9be9d5eSMiklos Szeredi 
72e9be9d5eSMiklos Szeredi int ovl_create_real(struct inode *dir, struct dentry *newdentry,
73e9be9d5eSMiklos Szeredi 		    struct kstat *stat, const char *link,
74e9be9d5eSMiklos Szeredi 		    struct dentry *hardlink, bool debug)
75e9be9d5eSMiklos Szeredi {
76e9be9d5eSMiklos Szeredi 	int err;
77e9be9d5eSMiklos Szeredi 
78e9be9d5eSMiklos Szeredi 	if (newdentry->d_inode)
79e9be9d5eSMiklos Szeredi 		return -ESTALE;
80e9be9d5eSMiklos Szeredi 
81e9be9d5eSMiklos Szeredi 	if (hardlink) {
82e9be9d5eSMiklos Szeredi 		err = ovl_do_link(hardlink, dir, newdentry, debug);
83e9be9d5eSMiklos Szeredi 	} else {
84e9be9d5eSMiklos Szeredi 		switch (stat->mode & S_IFMT) {
85e9be9d5eSMiklos Szeredi 		case S_IFREG:
86e9be9d5eSMiklos Szeredi 			err = ovl_do_create(dir, newdentry, stat->mode, debug);
87e9be9d5eSMiklos Szeredi 			break;
88e9be9d5eSMiklos Szeredi 
89e9be9d5eSMiklos Szeredi 		case S_IFDIR:
90e9be9d5eSMiklos Szeredi 			err = ovl_do_mkdir(dir, newdentry, stat->mode, debug);
91e9be9d5eSMiklos Szeredi 			break;
92e9be9d5eSMiklos Szeredi 
93e9be9d5eSMiklos Szeredi 		case S_IFCHR:
94e9be9d5eSMiklos Szeredi 		case S_IFBLK:
95e9be9d5eSMiklos Szeredi 		case S_IFIFO:
96e9be9d5eSMiklos Szeredi 		case S_IFSOCK:
97e9be9d5eSMiklos Szeredi 			err = ovl_do_mknod(dir, newdentry,
98e9be9d5eSMiklos Szeredi 					   stat->mode, stat->rdev, debug);
99e9be9d5eSMiklos Szeredi 			break;
100e9be9d5eSMiklos Szeredi 
101e9be9d5eSMiklos Szeredi 		case S_IFLNK:
102e9be9d5eSMiklos Szeredi 			err = ovl_do_symlink(dir, newdentry, link, debug);
103e9be9d5eSMiklos Szeredi 			break;
104e9be9d5eSMiklos Szeredi 
105e9be9d5eSMiklos Szeredi 		default:
106e9be9d5eSMiklos Szeredi 			err = -EPERM;
107e9be9d5eSMiklos Szeredi 		}
108e9be9d5eSMiklos Szeredi 	}
109e9be9d5eSMiklos Szeredi 	if (!err && WARN_ON(!newdentry->d_inode)) {
110e9be9d5eSMiklos Szeredi 		/*
111e9be9d5eSMiklos Szeredi 		 * Not quite sure if non-instantiated dentry is legal or not.
112e9be9d5eSMiklos Szeredi 		 * VFS doesn't seem to care so check and warn here.
113e9be9d5eSMiklos Szeredi 		 */
114e9be9d5eSMiklos Szeredi 		err = -ENOENT;
115e9be9d5eSMiklos Szeredi 	}
116e9be9d5eSMiklos Szeredi 	return err;
117e9be9d5eSMiklos Szeredi }
118e9be9d5eSMiklos Szeredi 
119e9be9d5eSMiklos Szeredi static int ovl_set_opaque(struct dentry *upperdentry)
120e9be9d5eSMiklos Szeredi {
121cead89bbShujianyang 	return ovl_do_setxattr(upperdentry, OVL_XATTR_OPAQUE, "y", 1, 0);
122e9be9d5eSMiklos Szeredi }
123e9be9d5eSMiklos Szeredi 
124e9be9d5eSMiklos Szeredi static void ovl_remove_opaque(struct dentry *upperdentry)
125e9be9d5eSMiklos Szeredi {
126e9be9d5eSMiklos Szeredi 	int err;
127e9be9d5eSMiklos Szeredi 
128cead89bbShujianyang 	err = ovl_do_removexattr(upperdentry, OVL_XATTR_OPAQUE);
129e9be9d5eSMiklos Szeredi 	if (err) {
130e9be9d5eSMiklos Szeredi 		pr_warn("overlayfs: failed to remove opaque from '%s' (%i)\n",
131e9be9d5eSMiklos Szeredi 			upperdentry->d_name.name, err);
132e9be9d5eSMiklos Szeredi 	}
133e9be9d5eSMiklos Szeredi }
134e9be9d5eSMiklos Szeredi 
135e9be9d5eSMiklos Szeredi static int ovl_dir_getattr(struct vfsmount *mnt, struct dentry *dentry,
136e9be9d5eSMiklos Szeredi 			 struct kstat *stat)
137e9be9d5eSMiklos Szeredi {
138e9be9d5eSMiklos Szeredi 	int err;
139e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
140e9be9d5eSMiklos Szeredi 	struct path realpath;
1411175b6b8SVivek Goyal 	const struct cred *old_cred;
142e9be9d5eSMiklos Szeredi 
143e9be9d5eSMiklos Szeredi 	type = ovl_path_real(dentry, &realpath);
1441175b6b8SVivek Goyal 	old_cred = ovl_override_creds(dentry->d_sb);
145e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&realpath, stat);
1461175b6b8SVivek Goyal 	revert_creds(old_cred);
147e9be9d5eSMiklos Szeredi 	if (err)
148e9be9d5eSMiklos Szeredi 		return err;
149e9be9d5eSMiklos Szeredi 
150e9be9d5eSMiklos Szeredi 	stat->dev = dentry->d_sb->s_dev;
151e9be9d5eSMiklos Szeredi 	stat->ino = dentry->d_inode->i_ino;
152e9be9d5eSMiklos Szeredi 
153e9be9d5eSMiklos Szeredi 	/*
154e9be9d5eSMiklos Szeredi 	 * It's probably not worth it to count subdirs to get the
155e9be9d5eSMiklos Szeredi 	 * correct link count.  nlink=1 seems to pacify 'find' and
156e9be9d5eSMiklos Szeredi 	 * other utilities.
157e9be9d5eSMiklos Szeredi 	 */
1581afaba1eSMiklos Szeredi 	if (OVL_TYPE_MERGE(type))
159e9be9d5eSMiklos Szeredi 		stat->nlink = 1;
160e9be9d5eSMiklos Szeredi 
161e9be9d5eSMiklos Szeredi 	return 0;
162e9be9d5eSMiklos Szeredi }
163e9be9d5eSMiklos Szeredi 
16472e48481SVivek Goyal /* Common operations required to be done after creation of file on upper */
16572e48481SVivek Goyal static void ovl_instantiate(struct dentry *dentry, struct inode *inode,
16651f7e52dSMiklos Szeredi 			    struct dentry *newdentry, bool hardlink)
16772e48481SVivek Goyal {
16872e48481SVivek Goyal 	ovl_dentry_version_inc(dentry->d_parent);
16972e48481SVivek Goyal 	ovl_dentry_update(dentry, newdentry);
17051f7e52dSMiklos Szeredi 	if (!hardlink) {
17139b681f8SMiklos Szeredi 		ovl_inode_update(inode, d_inode(newdentry));
17272e48481SVivek Goyal 		ovl_copyattr(newdentry->d_inode, inode);
17351f7e52dSMiklos Szeredi 	} else {
17451f7e52dSMiklos Szeredi 		WARN_ON(ovl_inode_real(inode, NULL) != d_inode(newdentry));
17551f7e52dSMiklos Szeredi 		inc_nlink(inode);
17651f7e52dSMiklos Szeredi 	}
17772e48481SVivek Goyal 	d_instantiate(dentry, inode);
17872e48481SVivek Goyal }
17972e48481SVivek Goyal 
180e9be9d5eSMiklos Szeredi static int ovl_create_upper(struct dentry *dentry, struct inode *inode,
181e9be9d5eSMiklos Szeredi 			    struct kstat *stat, const char *link,
182e9be9d5eSMiklos Szeredi 			    struct dentry *hardlink)
183e9be9d5eSMiklos Szeredi {
184e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
185e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
186e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
187e9be9d5eSMiklos Szeredi 	int err;
188e9be9d5eSMiklos Szeredi 
1895955102cSAl Viro 	inode_lock_nested(udir, I_MUTEX_PARENT);
190e9be9d5eSMiklos Szeredi 	newdentry = lookup_one_len(dentry->d_name.name, upperdir,
191e9be9d5eSMiklos Szeredi 				   dentry->d_name.len);
192e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
193e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
194e9be9d5eSMiklos Szeredi 		goto out_unlock;
195e9be9d5eSMiklos Szeredi 	err = ovl_create_real(udir, newdentry, stat, link, hardlink, false);
196e9be9d5eSMiklos Szeredi 	if (err)
197e9be9d5eSMiklos Szeredi 		goto out_dput;
198e9be9d5eSMiklos Szeredi 
19951f7e52dSMiklos Szeredi 	ovl_instantiate(dentry, inode, newdentry, !!hardlink);
200e9be9d5eSMiklos Szeredi 	newdentry = NULL;
201e9be9d5eSMiklos Szeredi out_dput:
202e9be9d5eSMiklos Szeredi 	dput(newdentry);
203e9be9d5eSMiklos Szeredi out_unlock:
2045955102cSAl Viro 	inode_unlock(udir);
205e9be9d5eSMiklos Szeredi 	return err;
206e9be9d5eSMiklos Szeredi }
207e9be9d5eSMiklos Szeredi 
208e9be9d5eSMiklos Szeredi static int ovl_lock_rename_workdir(struct dentry *workdir,
209e9be9d5eSMiklos Szeredi 				   struct dentry *upperdir)
210e9be9d5eSMiklos Szeredi {
211e9be9d5eSMiklos Szeredi 	/* Workdir should not be the same as upperdir */
212e9be9d5eSMiklos Szeredi 	if (workdir == upperdir)
213e9be9d5eSMiklos Szeredi 		goto err;
214e9be9d5eSMiklos Szeredi 
215e9be9d5eSMiklos Szeredi 	/* Workdir should not be subdir of upperdir and vice versa */
216e9be9d5eSMiklos Szeredi 	if (lock_rename(workdir, upperdir) != NULL)
217e9be9d5eSMiklos Szeredi 		goto err_unlock;
218e9be9d5eSMiklos Szeredi 
219e9be9d5eSMiklos Szeredi 	return 0;
220e9be9d5eSMiklos Szeredi 
221e9be9d5eSMiklos Szeredi err_unlock:
222e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
223e9be9d5eSMiklos Szeredi err:
224e9be9d5eSMiklos Szeredi 	pr_err("overlayfs: failed to lock workdir+upperdir\n");
225e9be9d5eSMiklos Szeredi 	return -EIO;
226e9be9d5eSMiklos Szeredi }
227e9be9d5eSMiklos Szeredi 
228e9be9d5eSMiklos Szeredi static struct dentry *ovl_clear_empty(struct dentry *dentry,
229e9be9d5eSMiklos Szeredi 				      struct list_head *list)
230e9be9d5eSMiklos Szeredi {
231e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
232e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
233e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
234e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
235e9be9d5eSMiklos Szeredi 	struct path upperpath;
236e9be9d5eSMiklos Szeredi 	struct dentry *upper;
237e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir;
238e9be9d5eSMiklos Szeredi 	struct kstat stat;
239e9be9d5eSMiklos Szeredi 	int err;
240e9be9d5eSMiklos Szeredi 
241cc6f67bcSMiklos Szeredi 	if (WARN_ON(!workdir))
242cc6f67bcSMiklos Szeredi 		return ERR_PTR(-EROFS);
243cc6f67bcSMiklos Szeredi 
244e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
245e9be9d5eSMiklos Szeredi 	if (err)
246e9be9d5eSMiklos Szeredi 		goto out;
247e9be9d5eSMiklos Szeredi 
248e9be9d5eSMiklos Szeredi 	ovl_path_upper(dentry, &upperpath);
249e9be9d5eSMiklos Szeredi 	err = vfs_getattr(&upperpath, &stat);
250e9be9d5eSMiklos Szeredi 	if (err)
251e9be9d5eSMiklos Szeredi 		goto out_unlock;
252e9be9d5eSMiklos Szeredi 
253e9be9d5eSMiklos Szeredi 	err = -ESTALE;
254e9be9d5eSMiklos Szeredi 	if (!S_ISDIR(stat.mode))
255e9be9d5eSMiklos Szeredi 		goto out_unlock;
256e9be9d5eSMiklos Szeredi 	upper = upperpath.dentry;
257e9be9d5eSMiklos Szeredi 	if (upper->d_parent->d_inode != udir)
258e9be9d5eSMiklos Szeredi 		goto out_unlock;
259e9be9d5eSMiklos Szeredi 
260e9be9d5eSMiklos Szeredi 	opaquedir = ovl_lookup_temp(workdir, dentry);
261e9be9d5eSMiklos Szeredi 	err = PTR_ERR(opaquedir);
262e9be9d5eSMiklos Szeredi 	if (IS_ERR(opaquedir))
263e9be9d5eSMiklos Szeredi 		goto out_unlock;
264e9be9d5eSMiklos Szeredi 
265e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, opaquedir, &stat, NULL, NULL, true);
266e9be9d5eSMiklos Szeredi 	if (err)
267e9be9d5eSMiklos Szeredi 		goto out_dput;
268e9be9d5eSMiklos Szeredi 
269e9be9d5eSMiklos Szeredi 	err = ovl_copy_xattr(upper, opaquedir);
270e9be9d5eSMiklos Szeredi 	if (err)
271e9be9d5eSMiklos Szeredi 		goto out_cleanup;
272e9be9d5eSMiklos Szeredi 
273e9be9d5eSMiklos Szeredi 	err = ovl_set_opaque(opaquedir);
274e9be9d5eSMiklos Szeredi 	if (err)
275e9be9d5eSMiklos Szeredi 		goto out_cleanup;
276e9be9d5eSMiklos Szeredi 
2775955102cSAl Viro 	inode_lock(opaquedir->d_inode);
278e9be9d5eSMiklos Szeredi 	err = ovl_set_attr(opaquedir, &stat);
2795955102cSAl Viro 	inode_unlock(opaquedir->d_inode);
280e9be9d5eSMiklos Szeredi 	if (err)
281e9be9d5eSMiklos Szeredi 		goto out_cleanup;
282e9be9d5eSMiklos Szeredi 
283e9be9d5eSMiklos Szeredi 	err = ovl_do_rename(wdir, opaquedir, udir, upper, RENAME_EXCHANGE);
284e9be9d5eSMiklos Szeredi 	if (err)
285e9be9d5eSMiklos Szeredi 		goto out_cleanup;
286e9be9d5eSMiklos Szeredi 
287e9be9d5eSMiklos Szeredi 	ovl_cleanup_whiteouts(upper, list);
288e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, upper);
289e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
290e9be9d5eSMiklos Szeredi 
291e9be9d5eSMiklos Szeredi 	/* dentry's upper doesn't match now, get rid of it */
292e9be9d5eSMiklos Szeredi 	d_drop(dentry);
293e9be9d5eSMiklos Szeredi 
294e9be9d5eSMiklos Szeredi 	return opaquedir;
295e9be9d5eSMiklos Szeredi 
296e9be9d5eSMiklos Szeredi out_cleanup:
297e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, opaquedir);
298e9be9d5eSMiklos Szeredi out_dput:
299e9be9d5eSMiklos Szeredi 	dput(opaquedir);
300e9be9d5eSMiklos Szeredi out_unlock:
301e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
302e9be9d5eSMiklos Szeredi out:
303e9be9d5eSMiklos Szeredi 	return ERR_PTR(err);
304e9be9d5eSMiklos Szeredi }
305e9be9d5eSMiklos Szeredi 
306a105d685SMiklos Szeredi static struct dentry *ovl_check_empty_and_clear(struct dentry *dentry)
307e9be9d5eSMiklos Szeredi {
308e9be9d5eSMiklos Szeredi 	int err;
309e9be9d5eSMiklos Szeredi 	struct dentry *ret = NULL;
310e9be9d5eSMiklos Szeredi 	LIST_HEAD(list);
311e9be9d5eSMiklos Szeredi 
312e9be9d5eSMiklos Szeredi 	err = ovl_check_empty_dir(dentry, &list);
313e9be9d5eSMiklos Szeredi 	if (err)
314e9be9d5eSMiklos Szeredi 		ret = ERR_PTR(err);
315a105d685SMiklos Szeredi 	else {
316a105d685SMiklos Szeredi 		/*
317a105d685SMiklos Szeredi 		 * If no upperdentry then skip clearing whiteouts.
318a105d685SMiklos Szeredi 		 *
319a105d685SMiklos Szeredi 		 * Can race with copy-up, since we don't hold the upperdir
320a105d685SMiklos Szeredi 		 * mutex.  Doesn't matter, since copy-up can't create a
321a105d685SMiklos Szeredi 		 * non-empty directory from an empty one.
322a105d685SMiklos Szeredi 		 */
323a105d685SMiklos Szeredi 		if (ovl_dentry_upper(dentry))
324e9be9d5eSMiklos Szeredi 			ret = ovl_clear_empty(dentry, &list);
325a105d685SMiklos Szeredi 	}
326e9be9d5eSMiklos Szeredi 
327e9be9d5eSMiklos Szeredi 	ovl_cache_free(&list);
328e9be9d5eSMiklos Szeredi 
329e9be9d5eSMiklos Szeredi 	return ret;
330e9be9d5eSMiklos Szeredi }
331e9be9d5eSMiklos Szeredi 
332e9be9d5eSMiklos Szeredi static int ovl_create_over_whiteout(struct dentry *dentry, struct inode *inode,
333e9be9d5eSMiklos Szeredi 				    struct kstat *stat, const char *link,
334e9be9d5eSMiklos Szeredi 				    struct dentry *hardlink)
335e9be9d5eSMiklos Szeredi {
336e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
337e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
338e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
339e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
340e9be9d5eSMiklos Szeredi 	struct dentry *upper;
341e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
342e9be9d5eSMiklos Szeredi 	int err;
343e9be9d5eSMiklos Szeredi 
344cc6f67bcSMiklos Szeredi 	if (WARN_ON(!workdir))
345cc6f67bcSMiklos Szeredi 		return -EROFS;
346cc6f67bcSMiklos Szeredi 
347e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
348e9be9d5eSMiklos Szeredi 	if (err)
349e9be9d5eSMiklos Szeredi 		goto out;
350e9be9d5eSMiklos Szeredi 
351e9be9d5eSMiklos Szeredi 	newdentry = ovl_lookup_temp(workdir, dentry);
352e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
353e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
354e9be9d5eSMiklos Szeredi 		goto out_unlock;
355e9be9d5eSMiklos Szeredi 
356e9be9d5eSMiklos Szeredi 	upper = lookup_one_len(dentry->d_name.name, upperdir,
357e9be9d5eSMiklos Szeredi 			       dentry->d_name.len);
358e9be9d5eSMiklos Szeredi 	err = PTR_ERR(upper);
359e9be9d5eSMiklos Szeredi 	if (IS_ERR(upper))
360e9be9d5eSMiklos Szeredi 		goto out_dput;
361e9be9d5eSMiklos Szeredi 
362e9be9d5eSMiklos Szeredi 	err = ovl_create_real(wdir, newdentry, stat, link, hardlink, true);
363e9be9d5eSMiklos Szeredi 	if (err)
364e9be9d5eSMiklos Szeredi 		goto out_dput2;
365e9be9d5eSMiklos Szeredi 
366bb0d2b8aSMiklos Szeredi 	/*
367bb0d2b8aSMiklos Szeredi 	 * mode could have been mutilated due to umask (e.g. sgid directory)
368bb0d2b8aSMiklos Szeredi 	 */
36951f7e52dSMiklos Szeredi 	if (!hardlink &&
37051f7e52dSMiklos Szeredi 	    !S_ISLNK(stat->mode) && newdentry->d_inode->i_mode != stat->mode) {
371bb0d2b8aSMiklos Szeredi 		struct iattr attr = {
372bb0d2b8aSMiklos Szeredi 			.ia_valid = ATTR_MODE,
373bb0d2b8aSMiklos Szeredi 			.ia_mode = stat->mode,
374bb0d2b8aSMiklos Szeredi 		};
375bb0d2b8aSMiklos Szeredi 		inode_lock(newdentry->d_inode);
376bb0d2b8aSMiklos Szeredi 		err = notify_change(newdentry, &attr, NULL);
377bb0d2b8aSMiklos Szeredi 		inode_unlock(newdentry->d_inode);
378bb0d2b8aSMiklos Szeredi 		if (err)
379bb0d2b8aSMiklos Szeredi 			goto out_cleanup;
380bb0d2b8aSMiklos Szeredi 	}
381bb0d2b8aSMiklos Szeredi 
38251f7e52dSMiklos Szeredi 	if (!hardlink && S_ISDIR(stat->mode)) {
383e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
384e9be9d5eSMiklos Szeredi 		if (err)
385e9be9d5eSMiklos Szeredi 			goto out_cleanup;
386e9be9d5eSMiklos Szeredi 
387e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper,
388e9be9d5eSMiklos Szeredi 				    RENAME_EXCHANGE);
389e9be9d5eSMiklos Szeredi 		if (err)
390e9be9d5eSMiklos Szeredi 			goto out_cleanup;
391e9be9d5eSMiklos Szeredi 
392e9be9d5eSMiklos Szeredi 		ovl_cleanup(wdir, upper);
393e9be9d5eSMiklos Szeredi 	} else {
394e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(wdir, newdentry, udir, upper, 0);
395e9be9d5eSMiklos Szeredi 		if (err)
396e9be9d5eSMiklos Szeredi 			goto out_cleanup;
397e9be9d5eSMiklos Szeredi 	}
39851f7e52dSMiklos Szeredi 	ovl_instantiate(dentry, inode, newdentry, !!hardlink);
399e9be9d5eSMiklos Szeredi 	newdentry = NULL;
400e9be9d5eSMiklos Szeredi out_dput2:
401e9be9d5eSMiklos Szeredi 	dput(upper);
402e9be9d5eSMiklos Szeredi out_dput:
403e9be9d5eSMiklos Szeredi 	dput(newdentry);
404e9be9d5eSMiklos Szeredi out_unlock:
405e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
406e9be9d5eSMiklos Szeredi out:
407e9be9d5eSMiklos Szeredi 	return err;
408e9be9d5eSMiklos Szeredi 
409e9be9d5eSMiklos Szeredi out_cleanup:
410e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, newdentry);
411e9be9d5eSMiklos Szeredi 	goto out_dput2;
412e9be9d5eSMiklos Szeredi }
413e9be9d5eSMiklos Szeredi 
41451f7e52dSMiklos Szeredi static int ovl_create_or_link(struct dentry *dentry, struct inode *inode,
41551f7e52dSMiklos Szeredi 			      struct kstat *stat, const char *link,
41651f7e52dSMiklos Szeredi 			      struct dentry *hardlink)
417e9be9d5eSMiklos Szeredi {
418e9be9d5eSMiklos Szeredi 	int err;
4191175b6b8SVivek Goyal 	const struct cred *old_cred;
4201175b6b8SVivek Goyal 	struct cred *override_cred;
421e9be9d5eSMiklos Szeredi 
422e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
423e9be9d5eSMiklos Szeredi 	if (err)
42451f7e52dSMiklos Szeredi 		return err;
425bb0d2b8aSMiklos Szeredi 
4263fe6e52fSAntonio Murdaca 	old_cred = ovl_override_creds(dentry->d_sb);
427d0e13f5bSMiklos Szeredi 	err = -ENOMEM;
428d0e13f5bSMiklos Szeredi 	override_cred = prepare_creds();
429d0e13f5bSMiklos Szeredi 	if (override_cred) {
430bb0d2b8aSMiklos Szeredi 		override_cred->fsuid = inode->i_uid;
431bb0d2b8aSMiklos Szeredi 		override_cred->fsgid = inode->i_gid;
432d0e13f5bSMiklos Szeredi 		put_cred(override_creds(override_cred));
433d0e13f5bSMiklos Szeredi 		put_cred(override_cred);
434e9be9d5eSMiklos Szeredi 
4351175b6b8SVivek Goyal 		if (!ovl_dentry_is_opaque(dentry))
43651f7e52dSMiklos Szeredi 			err = ovl_create_upper(dentry, inode, stat, link,
4371175b6b8SVivek Goyal 						hardlink);
4381175b6b8SVivek Goyal 		else
43951f7e52dSMiklos Szeredi 			err = ovl_create_over_whiteout(dentry, inode, stat,
440d0e13f5bSMiklos Szeredi 							link, hardlink);
441d0e13f5bSMiklos Szeredi 	}
442e9be9d5eSMiklos Szeredi 	revert_creds(old_cred);
443bb0d2b8aSMiklos Szeredi 	if (!err) {
444bb0d2b8aSMiklos Szeredi 		struct inode *realinode = d_inode(ovl_dentry_upper(dentry));
445bb0d2b8aSMiklos Szeredi 
446bb0d2b8aSMiklos Szeredi 		WARN_ON(inode->i_mode != realinode->i_mode);
447bb0d2b8aSMiklos Szeredi 		WARN_ON(!uid_eq(inode->i_uid, realinode->i_uid));
448bb0d2b8aSMiklos Szeredi 		WARN_ON(!gid_eq(inode->i_gid, realinode->i_gid));
449bb0d2b8aSMiklos Szeredi 	}
450e9be9d5eSMiklos Szeredi 	return err;
451e9be9d5eSMiklos Szeredi }
452e9be9d5eSMiklos Szeredi 
453e9be9d5eSMiklos Szeredi static int ovl_create_object(struct dentry *dentry, int mode, dev_t rdev,
454e9be9d5eSMiklos Szeredi 			     const char *link)
455e9be9d5eSMiklos Szeredi {
456e9be9d5eSMiklos Szeredi 	int err;
45751f7e52dSMiklos Szeredi 	struct inode *inode;
45851f7e52dSMiklos Szeredi 	struct kstat stat = {
45951f7e52dSMiklos Szeredi 		.rdev = rdev,
46051f7e52dSMiklos Szeredi 	};
461e9be9d5eSMiklos Szeredi 
462e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
46351f7e52dSMiklos Szeredi 	if (err)
46451f7e52dSMiklos Szeredi 		goto out;
465e9be9d5eSMiklos Szeredi 
46651f7e52dSMiklos Szeredi 	err = -ENOMEM;
46751f7e52dSMiklos Szeredi 	inode = ovl_new_inode(dentry->d_sb, mode);
46851f7e52dSMiklos Szeredi 	if (!inode)
46951f7e52dSMiklos Szeredi 		goto out_drop_write;
47051f7e52dSMiklos Szeredi 
47151f7e52dSMiklos Szeredi 	inode_init_owner(inode, dentry->d_parent->d_inode, mode);
47251f7e52dSMiklos Szeredi 	stat.mode = inode->i_mode;
47351f7e52dSMiklos Szeredi 
47451f7e52dSMiklos Szeredi 	err = ovl_create_or_link(dentry, inode, &stat, link, NULL);
47551f7e52dSMiklos Szeredi 	if (err)
47651f7e52dSMiklos Szeredi 		iput(inode);
47751f7e52dSMiklos Szeredi 
47851f7e52dSMiklos Szeredi out_drop_write:
47951f7e52dSMiklos Szeredi 	ovl_drop_write(dentry);
48051f7e52dSMiklos Szeredi out:
481e9be9d5eSMiklos Szeredi 	return err;
482e9be9d5eSMiklos Szeredi }
483e9be9d5eSMiklos Szeredi 
484e9be9d5eSMiklos Szeredi static int ovl_create(struct inode *dir, struct dentry *dentry, umode_t mode,
485e9be9d5eSMiklos Szeredi 		      bool excl)
486e9be9d5eSMiklos Szeredi {
487e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFREG, 0, NULL);
488e9be9d5eSMiklos Szeredi }
489e9be9d5eSMiklos Szeredi 
490e9be9d5eSMiklos Szeredi static int ovl_mkdir(struct inode *dir, struct dentry *dentry, umode_t mode)
491e9be9d5eSMiklos Szeredi {
492e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, (mode & 07777) | S_IFDIR, 0, NULL);
493e9be9d5eSMiklos Szeredi }
494e9be9d5eSMiklos Szeredi 
495e9be9d5eSMiklos Szeredi static int ovl_mknod(struct inode *dir, struct dentry *dentry, umode_t mode,
496e9be9d5eSMiklos Szeredi 		     dev_t rdev)
497e9be9d5eSMiklos Szeredi {
498e9be9d5eSMiklos Szeredi 	/* Don't allow creation of "whiteout" on overlay */
499e9be9d5eSMiklos Szeredi 	if (S_ISCHR(mode) && rdev == WHITEOUT_DEV)
500e9be9d5eSMiklos Szeredi 		return -EPERM;
501e9be9d5eSMiklos Szeredi 
502e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, mode, rdev, NULL);
503e9be9d5eSMiklos Szeredi }
504e9be9d5eSMiklos Szeredi 
505e9be9d5eSMiklos Szeredi static int ovl_symlink(struct inode *dir, struct dentry *dentry,
506e9be9d5eSMiklos Szeredi 		       const char *link)
507e9be9d5eSMiklos Szeredi {
508e9be9d5eSMiklos Szeredi 	return ovl_create_object(dentry, S_IFLNK, 0, link);
509e9be9d5eSMiklos Szeredi }
510e9be9d5eSMiklos Szeredi 
511e9be9d5eSMiklos Szeredi static int ovl_link(struct dentry *old, struct inode *newdir,
512e9be9d5eSMiklos Szeredi 		    struct dentry *new)
513e9be9d5eSMiklos Szeredi {
514e9be9d5eSMiklos Szeredi 	int err;
51551f7e52dSMiklos Szeredi 	struct inode *inode;
516e9be9d5eSMiklos Szeredi 
517e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
518e9be9d5eSMiklos Szeredi 	if (err)
519e9be9d5eSMiklos Szeredi 		goto out;
520e9be9d5eSMiklos Szeredi 
521e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
522e9be9d5eSMiklos Szeredi 	if (err)
523e9be9d5eSMiklos Szeredi 		goto out_drop_write;
524e9be9d5eSMiklos Szeredi 
52551f7e52dSMiklos Szeredi 	inode = d_inode(old);
52651f7e52dSMiklos Szeredi 	ihold(inode);
52751f7e52dSMiklos Szeredi 
52851f7e52dSMiklos Szeredi 	err = ovl_create_or_link(new, inode, NULL, NULL, ovl_dentry_upper(old));
52951f7e52dSMiklos Szeredi 	if (err)
53051f7e52dSMiklos Szeredi 		iput(inode);
531e9be9d5eSMiklos Szeredi 
532e9be9d5eSMiklos Szeredi out_drop_write:
533e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
534e9be9d5eSMiklos Szeredi out:
535e9be9d5eSMiklos Szeredi 	return err;
536e9be9d5eSMiklos Szeredi }
537e9be9d5eSMiklos Szeredi 
538a105d685SMiklos Szeredi static int ovl_remove_and_whiteout(struct dentry *dentry, bool is_dir)
539e9be9d5eSMiklos Szeredi {
540e9be9d5eSMiklos Szeredi 	struct dentry *workdir = ovl_workdir(dentry);
541e9be9d5eSMiklos Szeredi 	struct inode *wdir = workdir->d_inode;
542e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
543e9be9d5eSMiklos Szeredi 	struct inode *udir = upperdir->d_inode;
544e9be9d5eSMiklos Szeredi 	struct dentry *whiteout;
545e9be9d5eSMiklos Szeredi 	struct dentry *upper;
546e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
547e9be9d5eSMiklos Szeredi 	int err;
548cfc9fde0SMaxim Patlasov 	int flags = 0;
549e9be9d5eSMiklos Szeredi 
550cc6f67bcSMiklos Szeredi 	if (WARN_ON(!workdir))
551cc6f67bcSMiklos Szeredi 		return -EROFS;
552cc6f67bcSMiklos Szeredi 
553d377c5ebSMiklos Szeredi 	if (is_dir) {
554d377c5ebSMiklos Szeredi 		if (OVL_TYPE_MERGE_OR_LOWER(ovl_path_type(dentry))) {
555a105d685SMiklos Szeredi 			opaquedir = ovl_check_empty_and_clear(dentry);
556e9be9d5eSMiklos Szeredi 			err = PTR_ERR(opaquedir);
557e9be9d5eSMiklos Szeredi 			if (IS_ERR(opaquedir))
558e9be9d5eSMiklos Szeredi 				goto out;
559d377c5ebSMiklos Szeredi 		} else {
560d377c5ebSMiklos Szeredi 			LIST_HEAD(list);
561d377c5ebSMiklos Szeredi 
562d377c5ebSMiklos Szeredi 			/*
563d377c5ebSMiklos Szeredi 			 * When removing an empty opaque directory, then it
564d377c5ebSMiklos Szeredi 			 * makes no sense to replace it with an exact replica of
565d377c5ebSMiklos Szeredi 			 * itself.  But emptiness still needs to be checked.
566d377c5ebSMiklos Szeredi 			 */
567d377c5ebSMiklos Szeredi 			err = ovl_check_empty_dir(dentry, &list);
568d377c5ebSMiklos Szeredi 			ovl_cache_free(&list);
569d377c5ebSMiklos Szeredi 			if (err)
570d377c5ebSMiklos Szeredi 				goto out;
571d377c5ebSMiklos Szeredi 		}
572e9be9d5eSMiklos Szeredi 	}
573e9be9d5eSMiklos Szeredi 
574e9be9d5eSMiklos Szeredi 	err = ovl_lock_rename_workdir(workdir, upperdir);
575e9be9d5eSMiklos Szeredi 	if (err)
576e9be9d5eSMiklos Szeredi 		goto out_dput;
577e9be9d5eSMiklos Szeredi 
578e9be9d5eSMiklos Szeredi 	upper = lookup_one_len(dentry->d_name.name, upperdir,
579e9be9d5eSMiklos Szeredi 			       dentry->d_name.len);
580e9be9d5eSMiklos Szeredi 	err = PTR_ERR(upper);
581e9be9d5eSMiklos Szeredi 	if (IS_ERR(upper))
582cfc9fde0SMaxim Patlasov 		goto out_unlock;
583e9be9d5eSMiklos Szeredi 
584e9be9d5eSMiklos Szeredi 	err = -ESTALE;
585cfc9fde0SMaxim Patlasov 	if ((opaquedir && upper != opaquedir) ||
586cfc9fde0SMaxim Patlasov 	    (!opaquedir && ovl_dentry_upper(dentry) &&
587cfc9fde0SMaxim Patlasov 	     upper != ovl_dentry_upper(dentry))) {
588cfc9fde0SMaxim Patlasov 		goto out_dput_upper;
589cfc9fde0SMaxim Patlasov 	}
590e9be9d5eSMiklos Szeredi 
591cfc9fde0SMaxim Patlasov 	whiteout = ovl_whiteout(workdir, dentry);
592cfc9fde0SMaxim Patlasov 	err = PTR_ERR(whiteout);
593cfc9fde0SMaxim Patlasov 	if (IS_ERR(whiteout))
594cfc9fde0SMaxim Patlasov 		goto out_dput_upper;
595cfc9fde0SMaxim Patlasov 
596cfc9fde0SMaxim Patlasov 	if (d_is_dir(upper))
597cfc9fde0SMaxim Patlasov 		flags = RENAME_EXCHANGE;
598e9be9d5eSMiklos Szeredi 
599e9be9d5eSMiklos Szeredi 	err = ovl_do_rename(wdir, whiteout, udir, upper, flags);
600e9be9d5eSMiklos Szeredi 	if (err)
601e9be9d5eSMiklos Szeredi 		goto kill_whiteout;
602cfc9fde0SMaxim Patlasov 	if (flags)
603e9be9d5eSMiklos Szeredi 		ovl_cleanup(wdir, upper);
604cfc9fde0SMaxim Patlasov 
605e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(dentry->d_parent);
606e9be9d5eSMiklos Szeredi out_d_drop:
607e9be9d5eSMiklos Szeredi 	d_drop(dentry);
608e9be9d5eSMiklos Szeredi 	dput(whiteout);
609cfc9fde0SMaxim Patlasov out_dput_upper:
610cfc9fde0SMaxim Patlasov 	dput(upper);
611e9be9d5eSMiklos Szeredi out_unlock:
612e9be9d5eSMiklos Szeredi 	unlock_rename(workdir, upperdir);
613e9be9d5eSMiklos Szeredi out_dput:
614e9be9d5eSMiklos Szeredi 	dput(opaquedir);
615e9be9d5eSMiklos Szeredi out:
616e9be9d5eSMiklos Szeredi 	return err;
617e9be9d5eSMiklos Szeredi 
618e9be9d5eSMiklos Szeredi kill_whiteout:
619e9be9d5eSMiklos Szeredi 	ovl_cleanup(wdir, whiteout);
620e9be9d5eSMiklos Szeredi 	goto out_d_drop;
621e9be9d5eSMiklos Szeredi }
622e9be9d5eSMiklos Szeredi 
623e9be9d5eSMiklos Szeredi static int ovl_remove_upper(struct dentry *dentry, bool is_dir)
624e9be9d5eSMiklos Szeredi {
625e9be9d5eSMiklos Szeredi 	struct dentry *upperdir = ovl_dentry_upper(dentry->d_parent);
626e9be9d5eSMiklos Szeredi 	struct inode *dir = upperdir->d_inode;
62711f37104SMiklos Szeredi 	struct dentry *upper;
628e9be9d5eSMiklos Szeredi 	int err;
629e9be9d5eSMiklos Szeredi 
6305955102cSAl Viro 	inode_lock_nested(dir, I_MUTEX_PARENT);
63111f37104SMiklos Szeredi 	upper = lookup_one_len(dentry->d_name.name, upperdir,
63211f37104SMiklos Szeredi 			       dentry->d_name.len);
63311f37104SMiklos Szeredi 	err = PTR_ERR(upper);
63411f37104SMiklos Szeredi 	if (IS_ERR(upper))
63511f37104SMiklos Szeredi 		goto out_unlock;
63611f37104SMiklos Szeredi 
637e9be9d5eSMiklos Szeredi 	err = -ESTALE;
63811f37104SMiklos Szeredi 	if (upper == ovl_dentry_upper(dentry)) {
639e9be9d5eSMiklos Szeredi 		if (is_dir)
640e9be9d5eSMiklos Szeredi 			err = vfs_rmdir(dir, upper);
641e9be9d5eSMiklos Szeredi 		else
642e9be9d5eSMiklos Szeredi 			err = vfs_unlink(dir, upper, NULL);
643e9be9d5eSMiklos Szeredi 		ovl_dentry_version_inc(dentry->d_parent);
644e9be9d5eSMiklos Szeredi 	}
64511f37104SMiklos Szeredi 	dput(upper);
646e9be9d5eSMiklos Szeredi 
647e9be9d5eSMiklos Szeredi 	/*
648e9be9d5eSMiklos Szeredi 	 * Keeping this dentry hashed would mean having to release
649e9be9d5eSMiklos Szeredi 	 * upperpath/lowerpath, which could only be done if we are the
650e9be9d5eSMiklos Szeredi 	 * sole user of this dentry.  Too tricky...  Just unhash for
651e9be9d5eSMiklos Szeredi 	 * now.
652e9be9d5eSMiklos Szeredi 	 */
653ce9113bbSRui Wang 	if (!err)
654e9be9d5eSMiklos Szeredi 		d_drop(dentry);
65511f37104SMiklos Szeredi out_unlock:
6565955102cSAl Viro 	inode_unlock(dir);
657e9be9d5eSMiklos Szeredi 
658e9be9d5eSMiklos Szeredi 	return err;
659e9be9d5eSMiklos Szeredi }
660e9be9d5eSMiklos Szeredi 
661e9be9d5eSMiklos Szeredi static inline int ovl_check_sticky(struct dentry *dentry)
662e9be9d5eSMiklos Szeredi {
663e9be9d5eSMiklos Szeredi 	struct inode *dir = ovl_dentry_real(dentry->d_parent)->d_inode;
664e9be9d5eSMiklos Szeredi 	struct inode *inode = ovl_dentry_real(dentry)->d_inode;
665e9be9d5eSMiklos Szeredi 
666e9be9d5eSMiklos Szeredi 	if (check_sticky(dir, inode))
667e9be9d5eSMiklos Szeredi 		return -EPERM;
668e9be9d5eSMiklos Szeredi 
669e9be9d5eSMiklos Szeredi 	return 0;
670e9be9d5eSMiklos Szeredi }
671e9be9d5eSMiklos Szeredi 
672e9be9d5eSMiklos Szeredi static int ovl_do_remove(struct dentry *dentry, bool is_dir)
673e9be9d5eSMiklos Szeredi {
674e9be9d5eSMiklos Szeredi 	enum ovl_path_type type;
675e9be9d5eSMiklos Szeredi 	int err;
6761175b6b8SVivek Goyal 	const struct cred *old_cred;
6771175b6b8SVivek Goyal 
678e9be9d5eSMiklos Szeredi 
679e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(dentry);
680e9be9d5eSMiklos Szeredi 	if (err)
681e9be9d5eSMiklos Szeredi 		goto out;
682e9be9d5eSMiklos Szeredi 
683e9be9d5eSMiklos Szeredi 	err = ovl_want_write(dentry);
684e9be9d5eSMiklos Szeredi 	if (err)
685e9be9d5eSMiklos Szeredi 		goto out;
686e9be9d5eSMiklos Szeredi 
687e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(dentry->d_parent);
688e9be9d5eSMiklos Szeredi 	if (err)
689e9be9d5eSMiklos Szeredi 		goto out_drop_write;
690e9be9d5eSMiklos Szeredi 
691e9be9d5eSMiklos Szeredi 	type = ovl_path_type(dentry);
6921175b6b8SVivek Goyal 
6931175b6b8SVivek Goyal 	old_cred = ovl_override_creds(dentry->d_sb);
6941175b6b8SVivek Goyal 	if (OVL_TYPE_PURE_UPPER(type))
695e9be9d5eSMiklos Szeredi 		err = ovl_remove_upper(dentry, is_dir);
6961175b6b8SVivek Goyal 	else
697a105d685SMiklos Szeredi 		err = ovl_remove_and_whiteout(dentry, is_dir);
698e9be9d5eSMiklos Szeredi 	revert_creds(old_cred);
69951f7e52dSMiklos Szeredi 	if (!err && !is_dir)
70051f7e52dSMiklos Szeredi 		drop_nlink(dentry->d_inode);
701e9be9d5eSMiklos Szeredi out_drop_write:
702e9be9d5eSMiklos Szeredi 	ovl_drop_write(dentry);
703e9be9d5eSMiklos Szeredi out:
704e9be9d5eSMiklos Szeredi 	return err;
705e9be9d5eSMiklos Szeredi }
706e9be9d5eSMiklos Szeredi 
707e9be9d5eSMiklos Szeredi static int ovl_unlink(struct inode *dir, struct dentry *dentry)
708e9be9d5eSMiklos Szeredi {
709e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, false);
710e9be9d5eSMiklos Szeredi }
711e9be9d5eSMiklos Szeredi 
712e9be9d5eSMiklos Szeredi static int ovl_rmdir(struct inode *dir, struct dentry *dentry)
713e9be9d5eSMiklos Szeredi {
714e9be9d5eSMiklos Szeredi 	return ovl_do_remove(dentry, true);
715e9be9d5eSMiklos Szeredi }
716e9be9d5eSMiklos Szeredi 
717e9be9d5eSMiklos Szeredi static int ovl_rename2(struct inode *olddir, struct dentry *old,
718e9be9d5eSMiklos Szeredi 		       struct inode *newdir, struct dentry *new,
719e9be9d5eSMiklos Szeredi 		       unsigned int flags)
720e9be9d5eSMiklos Szeredi {
721e9be9d5eSMiklos Szeredi 	int err;
722e9be9d5eSMiklos Szeredi 	enum ovl_path_type old_type;
723e9be9d5eSMiklos Szeredi 	enum ovl_path_type new_type;
724e9be9d5eSMiklos Szeredi 	struct dentry *old_upperdir;
725e9be9d5eSMiklos Szeredi 	struct dentry *new_upperdir;
726e9be9d5eSMiklos Szeredi 	struct dentry *olddentry;
727e9be9d5eSMiklos Szeredi 	struct dentry *newdentry;
728e9be9d5eSMiklos Szeredi 	struct dentry *trap;
729e9be9d5eSMiklos Szeredi 	bool old_opaque;
730e9be9d5eSMiklos Szeredi 	bool new_opaque;
731e9be9d5eSMiklos Szeredi 	bool cleanup_whiteout = false;
732e9be9d5eSMiklos Szeredi 	bool overwrite = !(flags & RENAME_EXCHANGE);
733e36cb0b8SDavid Howells 	bool is_dir = d_is_dir(old);
734e9be9d5eSMiklos Szeredi 	bool new_is_dir = false;
735e9be9d5eSMiklos Szeredi 	struct dentry *opaquedir = NULL;
736e9be9d5eSMiklos Szeredi 	const struct cred *old_cred = NULL;
737e9be9d5eSMiklos Szeredi 
738e9be9d5eSMiklos Szeredi 	err = -EINVAL;
739e9be9d5eSMiklos Szeredi 	if (flags & ~(RENAME_EXCHANGE | RENAME_NOREPLACE))
740e9be9d5eSMiklos Szeredi 		goto out;
741e9be9d5eSMiklos Szeredi 
742e9be9d5eSMiklos Szeredi 	flags &= ~RENAME_NOREPLACE;
743e9be9d5eSMiklos Szeredi 
744e9be9d5eSMiklos Szeredi 	err = ovl_check_sticky(old);
745e9be9d5eSMiklos Szeredi 	if (err)
746e9be9d5eSMiklos Szeredi 		goto out;
747e9be9d5eSMiklos Szeredi 
748e9be9d5eSMiklos Szeredi 	/* Don't copy up directory trees */
749e9be9d5eSMiklos Szeredi 	old_type = ovl_path_type(old);
750e9be9d5eSMiklos Szeredi 	err = -EXDEV;
7511afaba1eSMiklos Szeredi 	if (OVL_TYPE_MERGE_OR_LOWER(old_type) && is_dir)
752e9be9d5eSMiklos Szeredi 		goto out;
753e9be9d5eSMiklos Szeredi 
754e9be9d5eSMiklos Szeredi 	if (new->d_inode) {
755e9be9d5eSMiklos Szeredi 		err = ovl_check_sticky(new);
756e9be9d5eSMiklos Szeredi 		if (err)
757e9be9d5eSMiklos Szeredi 			goto out;
758e9be9d5eSMiklos Szeredi 
759e36cb0b8SDavid Howells 		if (d_is_dir(new))
760e9be9d5eSMiklos Szeredi 			new_is_dir = true;
761e9be9d5eSMiklos Szeredi 
762e9be9d5eSMiklos Szeredi 		new_type = ovl_path_type(new);
763e9be9d5eSMiklos Szeredi 		err = -EXDEV;
7641afaba1eSMiklos Szeredi 		if (!overwrite && OVL_TYPE_MERGE_OR_LOWER(new_type) && new_is_dir)
765e9be9d5eSMiklos Szeredi 			goto out;
766e9be9d5eSMiklos Szeredi 
767e9be9d5eSMiklos Szeredi 		err = 0;
7681afaba1eSMiklos Szeredi 		if (!OVL_TYPE_UPPER(new_type) && !OVL_TYPE_UPPER(old_type)) {
769e9be9d5eSMiklos Szeredi 			if (ovl_dentry_lower(old)->d_inode ==
770e9be9d5eSMiklos Szeredi 			    ovl_dentry_lower(new)->d_inode)
771e9be9d5eSMiklos Szeredi 				goto out;
772e9be9d5eSMiklos Szeredi 		}
7731afaba1eSMiklos Szeredi 		if (OVL_TYPE_UPPER(new_type) && OVL_TYPE_UPPER(old_type)) {
774e9be9d5eSMiklos Szeredi 			if (ovl_dentry_upper(old)->d_inode ==
775e9be9d5eSMiklos Szeredi 			    ovl_dentry_upper(new)->d_inode)
776e9be9d5eSMiklos Szeredi 				goto out;
777e9be9d5eSMiklos Szeredi 		}
778e9be9d5eSMiklos Szeredi 	} else {
779e9be9d5eSMiklos Szeredi 		if (ovl_dentry_is_opaque(new))
7801afaba1eSMiklos Szeredi 			new_type = __OVL_PATH_UPPER;
781e9be9d5eSMiklos Szeredi 		else
7821afaba1eSMiklos Szeredi 			new_type = __OVL_PATH_UPPER | __OVL_PATH_PURE;
783e9be9d5eSMiklos Szeredi 	}
784e9be9d5eSMiklos Szeredi 
785e9be9d5eSMiklos Szeredi 	err = ovl_want_write(old);
786e9be9d5eSMiklos Szeredi 	if (err)
787e9be9d5eSMiklos Szeredi 		goto out;
788e9be9d5eSMiklos Szeredi 
789e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(old);
790e9be9d5eSMiklos Szeredi 	if (err)
791e9be9d5eSMiklos Szeredi 		goto out_drop_write;
792e9be9d5eSMiklos Szeredi 
793e9be9d5eSMiklos Szeredi 	err = ovl_copy_up(new->d_parent);
794e9be9d5eSMiklos Szeredi 	if (err)
795e9be9d5eSMiklos Szeredi 		goto out_drop_write;
796e9be9d5eSMiklos Szeredi 	if (!overwrite) {
797e9be9d5eSMiklos Szeredi 		err = ovl_copy_up(new);
798e9be9d5eSMiklos Szeredi 		if (err)
799e9be9d5eSMiklos Szeredi 			goto out_drop_write;
800e9be9d5eSMiklos Szeredi 	}
801e9be9d5eSMiklos Szeredi 
8021afaba1eSMiklos Szeredi 	old_opaque = !OVL_TYPE_PURE_UPPER(old_type);
8031afaba1eSMiklos Szeredi 	new_opaque = !OVL_TYPE_PURE_UPPER(new_type);
804e9be9d5eSMiklos Szeredi 
8053fe6e52fSAntonio Murdaca 	old_cred = ovl_override_creds(old->d_sb);
806e9be9d5eSMiklos Szeredi 
8071afaba1eSMiklos Szeredi 	if (overwrite && OVL_TYPE_MERGE_OR_LOWER(new_type) && new_is_dir) {
808a105d685SMiklos Szeredi 		opaquedir = ovl_check_empty_and_clear(new);
809e9be9d5eSMiklos Szeredi 		err = PTR_ERR(opaquedir);
810e9be9d5eSMiklos Szeredi 		if (IS_ERR(opaquedir)) {
811e9be9d5eSMiklos Szeredi 			opaquedir = NULL;
812e9be9d5eSMiklos Szeredi 			goto out_revert_creds;
813e9be9d5eSMiklos Szeredi 		}
814e9be9d5eSMiklos Szeredi 	}
815e9be9d5eSMiklos Szeredi 
816e9be9d5eSMiklos Szeredi 	if (overwrite) {
817e9be9d5eSMiklos Szeredi 		if (old_opaque) {
818e9be9d5eSMiklos Szeredi 			if (new->d_inode || !new_opaque) {
819e9be9d5eSMiklos Szeredi 				/* Whiteout source */
820e9be9d5eSMiklos Szeredi 				flags |= RENAME_WHITEOUT;
821e9be9d5eSMiklos Szeredi 			} else {
822e9be9d5eSMiklos Szeredi 				/* Switch whiteouts */
823e9be9d5eSMiklos Szeredi 				flags |= RENAME_EXCHANGE;
824e9be9d5eSMiklos Szeredi 			}
825e9be9d5eSMiklos Szeredi 		} else if (is_dir && !new->d_inode && new_opaque) {
826e9be9d5eSMiklos Szeredi 			flags |= RENAME_EXCHANGE;
827e9be9d5eSMiklos Szeredi 			cleanup_whiteout = true;
828e9be9d5eSMiklos Szeredi 		}
829e9be9d5eSMiklos Szeredi 	}
830e9be9d5eSMiklos Szeredi 
831e9be9d5eSMiklos Szeredi 	old_upperdir = ovl_dentry_upper(old->d_parent);
832e9be9d5eSMiklos Szeredi 	new_upperdir = ovl_dentry_upper(new->d_parent);
833e9be9d5eSMiklos Szeredi 
834e9be9d5eSMiklos Szeredi 	trap = lock_rename(new_upperdir, old_upperdir);
835e9be9d5eSMiklos Szeredi 
83611f37104SMiklos Szeredi 
83711f37104SMiklos Szeredi 	olddentry = lookup_one_len(old->d_name.name, old_upperdir,
83811f37104SMiklos Szeredi 				   old->d_name.len);
83911f37104SMiklos Szeredi 	err = PTR_ERR(olddentry);
84011f37104SMiklos Szeredi 	if (IS_ERR(olddentry))
84111f37104SMiklos Szeredi 		goto out_unlock;
84211f37104SMiklos Szeredi 
84311f37104SMiklos Szeredi 	err = -ESTALE;
84411f37104SMiklos Szeredi 	if (olddentry != ovl_dentry_upper(old))
84511f37104SMiklos Szeredi 		goto out_dput_old;
84611f37104SMiklos Szeredi 
847e9be9d5eSMiklos Szeredi 	newdentry = lookup_one_len(new->d_name.name, new_upperdir,
848e9be9d5eSMiklos Szeredi 				   new->d_name.len);
849e9be9d5eSMiklos Szeredi 	err = PTR_ERR(newdentry);
850e9be9d5eSMiklos Szeredi 	if (IS_ERR(newdentry))
85111f37104SMiklos Szeredi 		goto out_dput_old;
852e9be9d5eSMiklos Szeredi 
853e9be9d5eSMiklos Szeredi 	err = -ESTALE;
85411f37104SMiklos Szeredi 	if (ovl_dentry_upper(new)) {
85511f37104SMiklos Szeredi 		if (opaquedir) {
85611f37104SMiklos Szeredi 			if (newdentry != opaquedir)
857e9be9d5eSMiklos Szeredi 				goto out_dput;
85811f37104SMiklos Szeredi 		} else {
85911f37104SMiklos Szeredi 			if (newdentry != ovl_dentry_upper(new))
860e9be9d5eSMiklos Szeredi 				goto out_dput;
86111f37104SMiklos Szeredi 		}
86211f37104SMiklos Szeredi 	} else {
86311f37104SMiklos Szeredi 		if (!d_is_negative(newdentry) &&
86411f37104SMiklos Szeredi 		    (!new_opaque || !ovl_is_whiteout(newdentry)))
86511f37104SMiklos Szeredi 			goto out_dput;
86611f37104SMiklos Szeredi 	}
86711f37104SMiklos Szeredi 
868e9be9d5eSMiklos Szeredi 	if (olddentry == trap)
869e9be9d5eSMiklos Szeredi 		goto out_dput;
870e9be9d5eSMiklos Szeredi 	if (newdentry == trap)
871e9be9d5eSMiklos Szeredi 		goto out_dput;
872e9be9d5eSMiklos Szeredi 
873e9be9d5eSMiklos Szeredi 	if (is_dir && !old_opaque && new_opaque) {
874e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(olddentry);
875e9be9d5eSMiklos Szeredi 		if (err)
876e9be9d5eSMiklos Szeredi 			goto out_dput;
877e9be9d5eSMiklos Szeredi 	}
878e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && old_opaque && !new_opaque) {
879e9be9d5eSMiklos Szeredi 		err = ovl_set_opaque(newdentry);
880e9be9d5eSMiklos Szeredi 		if (err)
881e9be9d5eSMiklos Szeredi 			goto out_dput;
882e9be9d5eSMiklos Szeredi 	}
883e9be9d5eSMiklos Szeredi 
884e9be9d5eSMiklos Szeredi 	if (old_opaque || new_opaque) {
885e9be9d5eSMiklos Szeredi 		err = ovl_do_rename(old_upperdir->d_inode, olddentry,
886e9be9d5eSMiklos Szeredi 				    new_upperdir->d_inode, newdentry,
887e9be9d5eSMiklos Szeredi 				    flags);
888e9be9d5eSMiklos Szeredi 	} else {
889e9be9d5eSMiklos Szeredi 		/* No debug for the plain case */
890e9be9d5eSMiklos Szeredi 		BUG_ON(flags & ~RENAME_EXCHANGE);
891e9be9d5eSMiklos Szeredi 		err = vfs_rename(old_upperdir->d_inode, olddentry,
892e9be9d5eSMiklos Szeredi 				 new_upperdir->d_inode, newdentry,
893e9be9d5eSMiklos Szeredi 				 NULL, flags);
894e9be9d5eSMiklos Szeredi 	}
895e9be9d5eSMiklos Szeredi 
896e9be9d5eSMiklos Szeredi 	if (err) {
897e9be9d5eSMiklos Szeredi 		if (is_dir && !old_opaque && new_opaque)
898e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(olddentry);
899e9be9d5eSMiklos Szeredi 		if (!overwrite && new_is_dir && old_opaque && !new_opaque)
900e9be9d5eSMiklos Szeredi 			ovl_remove_opaque(newdentry);
901e9be9d5eSMiklos Szeredi 		goto out_dput;
902e9be9d5eSMiklos Szeredi 	}
903e9be9d5eSMiklos Szeredi 
904e9be9d5eSMiklos Szeredi 	if (is_dir && old_opaque && !new_opaque)
905e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(olddentry);
906e9be9d5eSMiklos Szeredi 	if (!overwrite && new_is_dir && !old_opaque && new_opaque)
907e9be9d5eSMiklos Szeredi 		ovl_remove_opaque(newdentry);
908e9be9d5eSMiklos Szeredi 
90945d11738SKonstantin Khlebnikov 	/*
91045d11738SKonstantin Khlebnikov 	 * Old dentry now lives in different location. Dentries in
91145d11738SKonstantin Khlebnikov 	 * lowerstack are stale. We cannot drop them here because
91245d11738SKonstantin Khlebnikov 	 * access to them is lockless. This could be only pure upper
91345d11738SKonstantin Khlebnikov 	 * or opaque directory - numlower is zero. Or upper non-dir
91445d11738SKonstantin Khlebnikov 	 * entry - its pureness is tracked by flag opaque.
91545d11738SKonstantin Khlebnikov 	 */
916e9be9d5eSMiklos Szeredi 	if (old_opaque != new_opaque) {
917e9be9d5eSMiklos Szeredi 		ovl_dentry_set_opaque(old, new_opaque);
918e9be9d5eSMiklos Szeredi 		if (!overwrite)
919e9be9d5eSMiklos Szeredi 			ovl_dentry_set_opaque(new, old_opaque);
920e9be9d5eSMiklos Szeredi 	}
921e9be9d5eSMiklos Szeredi 
922e9be9d5eSMiklos Szeredi 	if (cleanup_whiteout)
923e9be9d5eSMiklos Szeredi 		ovl_cleanup(old_upperdir->d_inode, newdentry);
924e9be9d5eSMiklos Szeredi 
925e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(old->d_parent);
926e9be9d5eSMiklos Szeredi 	ovl_dentry_version_inc(new->d_parent);
927e9be9d5eSMiklos Szeredi 
928e9be9d5eSMiklos Szeredi out_dput:
929e9be9d5eSMiklos Szeredi 	dput(newdentry);
93011f37104SMiklos Szeredi out_dput_old:
93111f37104SMiklos Szeredi 	dput(olddentry);
932e9be9d5eSMiklos Szeredi out_unlock:
933e9be9d5eSMiklos Szeredi 	unlock_rename(new_upperdir, old_upperdir);
934e9be9d5eSMiklos Szeredi out_revert_creds:
935e9be9d5eSMiklos Szeredi 	revert_creds(old_cred);
936e9be9d5eSMiklos Szeredi out_drop_write:
937e9be9d5eSMiklos Szeredi 	ovl_drop_write(old);
938e9be9d5eSMiklos Szeredi out:
939e9be9d5eSMiklos Szeredi 	dput(opaquedir);
940e9be9d5eSMiklos Szeredi 	return err;
941e9be9d5eSMiklos Szeredi }
942e9be9d5eSMiklos Szeredi 
943e9be9d5eSMiklos Szeredi const struct inode_operations ovl_dir_inode_operations = {
944e9be9d5eSMiklos Szeredi 	.lookup		= ovl_lookup,
945e9be9d5eSMiklos Szeredi 	.mkdir		= ovl_mkdir,
946e9be9d5eSMiklos Szeredi 	.symlink	= ovl_symlink,
947e9be9d5eSMiklos Szeredi 	.unlink		= ovl_unlink,
948e9be9d5eSMiklos Szeredi 	.rmdir		= ovl_rmdir,
949e9be9d5eSMiklos Szeredi 	.rename2	= ovl_rename2,
950e9be9d5eSMiklos Szeredi 	.link		= ovl_link,
951e9be9d5eSMiklos Szeredi 	.setattr	= ovl_setattr,
952e9be9d5eSMiklos Szeredi 	.create		= ovl_create,
953e9be9d5eSMiklos Szeredi 	.mknod		= ovl_mknod,
954e9be9d5eSMiklos Szeredi 	.permission	= ovl_permission,
955e9be9d5eSMiklos Szeredi 	.getattr	= ovl_dir_getattr,
956e9be9d5eSMiklos Szeredi 	.setxattr	= ovl_setxattr,
957e9be9d5eSMiklos Szeredi 	.getxattr	= ovl_getxattr,
958e9be9d5eSMiklos Szeredi 	.listxattr	= ovl_listxattr,
959e9be9d5eSMiklos Szeredi 	.removexattr	= ovl_removexattr,
96039a25b2bSVivek Goyal 	.get_acl	= ovl_get_acl,
961d719e8f2SMiklos Szeredi 	.update_time	= ovl_update_time,
962e9be9d5eSMiklos Szeredi };
963